回归平均|的定义及例子

发布于2022年10月15日Kassiani Nikolopoulou．2022年11月18日修订。

均值回归(RTM)统计现象是如何描述的呢变量远高于或低于的意思是在第二次测量时往往更接近平均值。

回归到平均值是由于自然变化或偶然性。它可以在日常生活，特别是在研究中故意关注最极端的情况或事件。它有时也被称为回归向的意思是．

例子:回归均值

回归均值可以解释所谓的“《体育画报》不祥的人。”这个都市传说声称，出现在体育杂志封面的运动员或球队将在下一场比赛中表现不佳。

封面上的球员或球队如果通过出色的表现赢得了他们的地位。但运动上的成功是技术和运气的结合，即使是最好的运动员也不总是赢。

好运气很可能不会永远持续下去，非凡的成功也不可能永远持续下去。

换句话说，由于RTM的存在，一个伟大的表演之后更有可能是一个平庸的表演，而不是另一个伟大的表演，给人的印象是出现在封面上会带来坏运气。

回归均值在重复测量中很常见(试设计)和应该总是被认为是观测到的变化的可能原因。它被认为是一种信息偏倚还会扭曲研究结果。

什么是均值回归?

当在第一次测量中极高或极低的变量在第二次测量中接近平均值时，就可以观察到向平均值的回归。

总的来说，RTM解释了为什么不寻常的事件之后可能会有更典型的事件。假设一家公司有一个很棒的季度，超过了所有设定的目标。随着时间的推移，出色的业绩很难保持，下一个季度的业绩很有可能会变差，使公司的业绩回到平均水平。任何能受到偶然因素影响的事物都属于这种现象。

均值回归发生在从样本中选择非随机样本时人口你测量两个不完全相关的变量，比如两次连续的血压测量。

越小相关两者之间，RTM效应越大。
总体均值的值越极端，回归到均值的空间就越大。

均值回归可以通过考虑，例如，由于运气的作用，技能和表现是不完全相关的来解释。这可能会引导你找到一个因果没有关系的地方。

为什么回归到均值是一个问题?

回归均值可能会出现问题，特别是在衡量干预、计划或政策有效性的研究中。

它会误导研究人员，让他们相信干预是观察到的变化的原因，而实际上这是由于偶然。当研究人员专注于测量极端的人、案例或组织时，例如表现最差的、受教育程度最高的或最不健康的组织，这一点尤其明显。

RTM告诉我们，从统计上看，最低的病例在第二次治疗时可能会有所改善，而那些处于高峰的病例即使没有干预，也可能会表现得更差。因为它可以扭曲结果，你需要考虑回归到平均的时候设计研究在分析你的发现时也是如此。

否则，你就会冒着将某些结果归因于特定原因的风险，而实际上它们很可能是偶然的。

回归到均值的例子

均值回归通常发生在衡量干预措施的效果时。

例如:测量干预的效果

你有兴趣了解一门自定进度的在线课程是否可以帮助中学生弥补数学学习上的差距。你所在地区的一所学校同意参与试点研究。

为了找出哪些学生最需要帮助，你对一个八年级的班级进行了数学测试。你挑选出表现最差的10%的学生，并将他们分配到在线课程。

课程结束后，表现最差的10%的学生再参加一次考试。平均而言，他们的分数有所提高。校长对结果很满意，决定为所有数学成绩不佳的八年级学生开设这门在线课程。

在学年结束时，这些学生的成绩并不比前一年好多少。根据表现最差的10%的学生的成绩，他们当然没有提高到你预期的程度。

这里的问题是回归到均值。在第一次考试中表现不佳的学生中，也有由于偶然因素而表现不佳的学生:也许他们前一天晚上没睡好，或者他们生病了或压力太大。这些学生在第二次测试中表现得更好，不管干预(在线项目)如何。因此，他们提高了表现最差的10%学生的平均分。

与此相关，在估计干预效果时，随机评估对于避免回归均值至关重要。

例子:回归平均和疾病

随机对照试验被认为是医学研究的黄金标准。原因之一是回归均值。

在患有特定疾病(如流感)的人群中，症状各不相同。如果研究人员只在病情严重的患者身上试验新的药物或治疗方法，那么回归均值可能会影响研究的结果实验．

有严重症状的人本质上具有与人群不同的特征的意思是．正因为如此，他们对干预的反应往往比症状较轻的人更强烈。

当某件事在第一次被认为是极端的时候，它很可能在以后被认为不是那么极端。由于许多疾病都有自然的起起伏伏，所以在病人最糟糕的时候进行治疗会使几乎任何治疗看起来都有效。

因此，所有症状级别的患者都应该接受治疗，以测试治疗的真正有效性。

如何避免回归均值

避免回归到均值的最好方法是在研究的设计阶段考虑到它。只要可能，使用概率抽样法．否则，你的结果可能倾向于极端，要么异常地高，要么异常地低。根据设计，这些将在重新测试时回归到平均值。

在实验设计，使用a是很重要的对照组一个治疗小组，随机分配每个参与者。对照组的变化可以帮助您评估由回归到均值所引起的变化的程度安慰剂效应．实验组与对照组相比，任何额外的改善或恶化都可以归因于干预，只要是干预统计上显著．

计算回归到均值的百分比

或者，您可以在数据分析期间计算回归到平均值的百分比。你可以使用下面的公式来计算回归均值。

人口、难民和移民事务局= 100(1 -r),人口、难民和移民事务局=回归均值的百分比r = 相关系数

当有完美的相关性那么，在变量之间r= 1

用上面的公式，人口、难民和移民事务局= 100(1 - 1) = 0
换句话说，如果你的变量完全相关，它们就不会回归到均值。

相反，当有的时候没有相关（r= 0)， 100%回归均值。

当有不完美的相关性那么，在变量之间r介于-1和+1之间。

如果你举个例子r= 0.2时，有80%的均值回归:

人口、难民和移民事务局= 100(1 - 0.2)
人口、难民和移民事务局= 100 (0.8)
人口、难民和移民事务局= 80%

其他类型的研究偏见

认知偏见

选择性偏差

其他

常见问题

信息偏见主要有哪些类型?: 信息偏倚是描述各种形式的通称吗研究偏见由系统测量误差引起。信息偏见的主要类型有:

回忆偏倚

观察者偏见

性能偏差

均值回归(RTM)
什么是相关系数?: 一个相关系数是描述变量之间关系的强度和方向的单个数字。

不同类型的相关系数可能适用于您的数据测量水平而且分布．的皮尔逊积矩相关系数r）通常用于评估两个定量变量之间的线性关系。
为什么相关性并不意味着因果关系?: 第三个变量和方向性问题是两个主要原因相关性不是因果关系．

的第三个变量问题意味着混杂变量影响两个变量，使它们看起来是因果相关的，但实际上不是。

的方向性问题是指两个变量相互关联，实际上可能存在因果关系，但不可能得出哪个变量导致了另一个变量的变化。

引用这篇Scribbr文章

如果你想引用这个来源，你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮，自动添加到我们的免费引用生成器引用。

尼克罗普卢(2022年11月18日)。回归平均|的定义及例子。Scribbr。检索于2022年12月14日，来自//www.charpingshvac.com/research-bias/regression-to-the-mean/

引用本文

这篇文章有用吗?

你已经投票了。谢谢:-) 你的投票被保存了:-) 处理你的投票…

Kassiani Nikolopoulou

Kassiani拥有传播学、生物经济和循环经济的学术背景。作为一名前记者，她喜欢将复杂的科学信息转化为易于获取的文章，以帮助学生。

让语言专家提高你的写作水平

在10分钟内做一次免费的抄袭检查

免费生成准确的引用