什么是生存偏差?|定义和示例
生存偏差当研究人员专注于通过某种选择过程的个人、群体或案例,而忽略那些没有通过选择过程的人时,就会发生这种情况。生存偏差可以导致研究人员形成不正确的结论,由于只研究的子集人口.生存偏差是一种选择性偏差.
什么是生存偏差?
生存偏差是一种选择性偏差.当数据集只考虑现有的(或“幸存的”)观测数据,而不考虑已经停止存在的观测数据时,就会发生这种情况。
例如,在调查科技行业的盈利能力时,人们还必须研究那些破产的企业,而不是只关注目前市场上的企业。
专注于你的一个子集样本已经通过某种选择过程的东西会增加你得出错误结论的几率。“幸存的”观测可能正是因为它们更能适应困难的条件而幸存下来,而其他观测则由于同样的条件而不复存在。
生存偏差为什么重要
当一项研究受到生存偏倚的影响时,我们只关注部分数据。这可能会产生一些后果,例如:
- 不代表现实的过于乐观的结论,使我们认为环境比实际情况更容易或更容易对我们有利。只研究成功的企业家或初创公司会有这种效果。
- 误解的相关,或者看到因果没有关系的地方。例如,高中或大学辍学者会成为成功的企业家尽管离开学校,而不是因为它。
- 不完整的决策,错过了那些没有“生存下来”的重要信息,比如那些在看似肥沃的增长环境中失败的企业,或者那些努力工作的创始人。
生存偏差的意识很重要,因为它会影响我们的感知、判断和结论的质量。
生存偏差的例子
生存偏差不仅在研究中,而且在日常生活中也会影响我们的判断。
与此相关,在得出任何结论之前,你需要问问自己你的数据集是否真正完整。否则,你也有生存偏差的风险。
如何防止生存偏差
生存偏差是一个常见的逻辑错误,但你可以采取以下几个步骤来避免它:
- 考虑一下你的数据中缺少什么,问问自己:你的数据集完整吗?哪些观察结果没有从事件或选择过程中“幸存”下来?想想那些倒闭的企业,没有成为亿万富翁的辍学者,或者没有表现出改善的临床试验参与者。
- 选择精心设计以确保准确性的数据源。注意不要省略观察现在已经不存在了,会改变你的分析和结论。例如,也要寻找发表负面研究结果的学术期刊。
- 当清理数据,注意离群值去除。如果您不理解异常值的含义,可能会意外删除关键信息。确定任何极端值是真正的错误还是代表其他东西是至关重要的。研究领域的专家可以帮助你,因为他们最了解这个领域。
意识到生存偏差,以及对你的假设公开和透明,是预防它的最佳策略。
其他类型的研究偏见
关于生存偏差的常见问题
- 信度和效度的区别是什么?
-
信度和效度都是关于一个方法度量某物的好坏:
如果你在做实验研究,你还必须考虑内部有效性和外部有效性你的实验。
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。