统计能力及其重要性|简单介绍

统计能力,或敏感性,是一个的可能性显著性检验在实际存在效果时检测效果。

真效应是一个群体中变量之间的真实的、非零的关系。效应通常由组间的真实差异或变量间的相关性来表示。

研究中的高功率表明测试检测到真实效果的几率很大。低功率意味着你的测试只有很小的机会检测到真实的效果,或者结果很可能被r扭曲随机和系统错误

功率主要受样本量、效应量和显著性水平的影响。幂分析可用于确定研究所需的样本量。

为什么权力在统计学中很重要?

有足够的统计能力对得出准确的结论是必要的人口使用示例数据。

假设检验,你从零假设和替代假设:一个没有影响的零假设和一个真正影响的替代假设(你的实际研究预测)。

目标是从样本中收集足够的数据,以统计地检验你是否可以合理地拒绝零假设而支持备择假设。

示例:零假设和替代假设
你的研究问题关注花时间在大自然中是否能抑制大学毕业生的压力。你把它改写成零假设和备择假设。

  • 零假设:对于刚毕业的大学生来说,每天在户外自然环境中呆上10分钟对缓解压力没有任何效果。
  • 备择假设:对于刚毕业的大学生来说,每天花10分钟在户外的自然环境中可以减轻压力症状。

总有犯错的风险第一类或第二类错误在解释研究结果时:

  • 第一类错误:拒绝no的零假设效果当它是真的。
  • 第二类错误:当零假设为假时,不拒绝无影响的零假设。
例如:I型和II型错误
  • 第一类错误:你认为每天花10分钟在大自然中可以减轻压力,但实际上并不能。
  • 第二类错误:你得出结论,每天花10分钟在大自然中并不会影响压力,但实际上它确实会影响压力。

幂是避免第二类错误的概率。测试的统计能力越高,出现第二类错误的风险就越低。

功率通常设置为80%。这意味着,如果在100个不同的研究中以80%的概率发现了真正的影响,那么100个统计测试中只有80个能真正检测到它们。

如果你不能保证足够的能量,你的研究可能根本无法检测到真正的效果。这意味着时间和金钱等资源被浪费了,从参与者那里收集数据甚至可能是不道德的(尤其是在临床试验中)。

另一方面,太大的功率意味着您的测试对真实的影响高度敏感,包括非常小的影响。这可能会导致发现统计上显著这些结果在现实世界中用处不大。

为了平衡低统计功率和高统计功率的利弊,您应该使用功率分析来设置适当的水平。

什么是权力分析?

功率分析是一种计算艾滋病你在确定你的研究的最小样本量。

功率分析由四个主要部分组成。如果你知道或估计了其中任何三个分量,你就可以计算第四个分量。

  • 统计力量:测试检测到一定大小的影响(如果有的话)的可能性,通常设置为80%或更高。
  • 样本大小:最小数量观察需要在给定的功率水平下观察一定大小的效果。
  • 显著性水平(alpha)拒绝一个你愿意接受的真零假设的最大风险,通常设置为5%。
  • 预期效应量:一种表达你的研究预期结果大小的标准化方法,通常基于类似的研究或初步研究。

在开始研究之前,您可以使用功率分析来计算所需功率水平和显著性水平以及预期效应量的最小样本量。

传统上,显著性水平设置为5%,期望功率水平设置为80%。这意味着你只需要计算出预期的效应大小,就可以从功率分析中计算出样本大小。

为了计算样本量或执行功率分析,使用在线工具或统计软件,如G *力量

样本大小

样本量与功率呈正相关。一个小样本(少于30个单位)可能只有低功率,而一个大样本有高功率。

增加样本量可以增强功率,但只是在一定程度上。当你有一个足够大的样本时,每一个观察结果都只会略微增加样本的功率。这意味着收集更多的数据会增加你研究的时间、成本和努力,而不会带来更多的好处。

你的研究设计也与力量和样本量有关:

  • 在一个试设计,每个参与者在研究的所有治疗中都进行了测试,因此个体差异不会不均匀地影响不同治疗的结果。
  • 在一个主题之间的设计在美国,每个参与者只参加一次治疗,因此每次治疗的参与者不同,个体差异可能会影响结果。

主题内设计功能更强大,因此需要的参与者更少。在课题间设计中需要更多的参与者来建立课题间的关系变量

显著性水平

显著性水平一项研究的第一类错误概率,和这是通常设定在5%。这意味着你的发现在零假设下发生的概率必须小于5%,才被认为具有统计学意义。

显著性水平与功率相关:增加显著性水平(例如,从5%到10%)会增加功率。当你降低显著性水平时,你的显著性检验变得更加保守,对检测真实效应不那么敏感。

研究人员必须通过考虑风险的大小来平衡犯第一类和第二类错误的风险他们愿意接受假阳性和假阴性的结论。

影响的大小

影响的大小是组间差异的大小或变量之间的关系。它表示现实意义一个发现。

虽然高强度的研究可以帮助你发现研究中的中等和较大的影响,但低强度的研究可能只能捕捉到较大的影响。

示例:估计预期的效应大小
在你的研究中,主要的影响是每天在大自然中度过的时间所导致的基线和后续压力水平的差异。

为了确定预期的效应大小,您需要执行系统的文献综述为了找到类似的研究。你将相关研究的范围缩小到只有那些操纵在自然中花费的时间并将压力作为主要衡量标准的研究。

对于符合这些标准的五项研究,你取它们各自报告的效应量并计算a的意思是影响的大小。取这个均值作为预期效应大小。

总有一些抽样误差在使用样本数据对总体进行推断时涉及。这意味着观察到的效应量和真实效应量之间总是存在差异。研究中的效应大小可能因随机因素、测量误差或样本中的自然变化而变化。

低强度的研究大多只有当它们在研究中很大的时候才会发现真正的影响。这意味着,在一项低功率研究中,任何观察到的影响都更有可能由不相关的因素增强。

如果低功率研究在某一特定领域是常态,比如神经科学,观察到的效应量会不断夸大或高估真实效应。

以下是学生们喜欢Scribbr校对服务的原因

发现校对和编辑

其他影响权力的因素

除了这四个主要因素外,在确定功率时还需要考虑其他因素。

可变性

可变性总体特征影响你的测试能力。高的人口方差减少权力。

换句话说,使用具有较大变量值范围的总体将降低测试的敏感性,而使用变量分布相对狭窄的总体将提高测试的敏感性。

使用具有明确人口统计学特征的相当特定的人群可以降低利益变量的扩散,提高权力。

示例:最小化可变性
压力是一个变量,在整个美国人口中变化很大。但同样的变量可以在一个特定的、定义明确的人群中分布得更窄(取值范围更小),比如25岁以下的女大学毕业生。压力水平的低变异性将提高你在压力研究中的测试能力。

测量误差

测量误差是某物的真实值与观测值或记录值之间的差值。测量的精确程度取决于测量仪器和研究人员,因此几乎总是存在一些误差。

一项研究的测量误差越高,测试的统计能力就越低。测量误差可以是随机的,也可以是系统的:

  • 随机误差由于偶然因素而不可预测和不均匀地改变测量(例如,情绪变化会影响调查反应,或者糟糕的一天可能会导致研究人员错误记录观察结果)。
  • 系统误差从一个测量到下一个测量,以可预测的方式影响数据(例如,校准错误的设备将持续记录不准确的数据,或有问题的调查问题可能导致有偏见的回答)。

如何增加能量?

由于许多研究方面直接或间接地影响权力,因此提高权力的方法也有多种。虽然其中一些通常可以实现,但其他的代价很高或涉及与其他重要考虑因素的权衡。

增加效果大小。为了在实验中增加预期效果,你可以操纵你的独立变量更广泛地(例如,花1小时而不是10分钟在大自然中)来增加对因变量(压力水平)的影响。这可能并不总是可能的,因为实验结果的变化是有限的。

增加样本量。根据样本量计算,您可能有空间增加样本量,同时仍有意义地提高功率。但有一个点,增加你的样本量可能不会产生足够高的效益。

提高显著性水平。虽然这使得测试对检测真实效果更加敏感,但也增加了犯第一类错误的风险。

减少测量误差。提高您的测量设备和程序的精度和准确性,减少可变性,改善可靠性和权力。采用多种措施或方法,称为三角测量,也可以帮助减少系统性研究偏见

使用单侧测试而不是双侧测试。当使用t测验z测试,单尾测试有更高的幂。然而,单尾检验只应该在有强烈理由期望在特定方向上产生影响时使用(例如,一个平均分将更高另一个),因为它将无法检测到另一个方向的影响。相比之下,双尾检验能够检测到任何一个方向上的影响。

关于统计能力的常见问题

什么是统计能力?

在统计学中,权力指的是发生事件的可能性假设检验如果真的有效果,就去检测。统计上强大的测试更有可能拒绝假阴性(第二类错误)。

如果你在学习中没有保证足够的能量,你可能无法检测到统计上显著结果,即使它有实际意义。你的研究可能无法回答你的研究问题。

什么是统计显著性?

统计显著性研究人员使用的一个术语是表示他们的观察不太可能发生在零假设统计检验.意义通常用a表示p价值,或概率值。

统计显著性是任意的——它取决于研究人员选择的阈值或alpha值。最常见的阈值是p< 0.05,这意味着该数据可能出现在低于5%的情况下零假设

p-value低于所选的alpha值,那么我们说测试的结果具有统计显著性。

什么是权力分析?

功率分析是一种计算,可以帮助您确定研究的最小样本量。它由四个主要部分组成。如果你知道或估计了其中任何三个分量,你就可以计算第四个分量。

  • 统计能力:测试检测到一定大小的影响(如果有的话)的可能性,通常设置为80%或更高。
  • 样本大小:在给定功率水平下观察一定大小的效应所需的最小观测次数。
  • 显著性水平(α):拒绝一个你愿意接受的真零假设的最大风险,通常设置为5%。
  • 预期影响的大小:一种表达你的研究预期结果大小的标准化方式,通常基于类似的研究或初步研究。
如何提高统计能力?

提高功率的方法有很多种:

  • 通过操纵您的独立变量更强烈,
  • 增加样本量,
  • 增加了显著性水平(α),
  • 通过提高测量设备和程序的精度和准确度来减少测量误差,
  • 使用单侧检验而不是双侧检验t测试而且z测试。

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

班达里,P.(2022年11月11日)。统计能力及其重要性|简单介绍Scribbr。检索于2022年12月19日,来自//www.charpingshvac.com/statistics/statistical-power/

这篇文章有用吗?
Pritha班达里

普里塔拥有英语、心理学和认知神经科学方面的学术背景。作为一名跨学科研究人员,她喜欢为学生和学者撰写文章,解释棘手的研究概念。
Baidu