什么是标准误差?|如何计算(示例指南)
的标准误差的意思是,或简单地标准错误,表示总体均值与样本均值的可能差异有多大。它告诉你如果你在一个单一样本中使用新的样本重复一项研究,样本均值会有多大变化人口.
平均值的标准误差(SE或SEM)是最常报告的标准误差类型。但你也可以找到其他统计数据的标准误差,比如中位数或比例。标准误差是抽样误差的一种常用测量方法总体参数和样本统计量.
为什么标准误差很重要
在统计学中,数据来自样品用于理解较大的种群。标准误差很重要,因为它可以帮助你估计样本数据在多大程度上代表整个总体。
与概率抽样,其中样本的元素是随机选择的,您可以收集数据这很可能是人口的代表性。然而,即使使用概率抽样,也会存在一些抽样误差。这是因为从均值和标准差等衡量标准来看,样本永远不会完全匹配它所来自的总体。
通过计算标准误差,你可以估计你的样本在总体中的代表性,并得出有效的结论。
较高的标准误差表明样本均值广泛分布在总体均值周围——你的样本可能不能很好地代表你的总体。低标准误差表明样本均值紧密地分布在总体均值周围——你的样本代表了你的总体。
可以通过增加样本量来减小标准误差。使用大的随机样本是最小化的最好方法抽样偏差.
标准误差和标准偏差
- 的标准偏差描述变化在一个样本中.
- 的标准错误估计可变性跨越多个样本人口的。
标准差是a描述性统计这可以从样本数据中计算出来。相比之下,标准误差是推论统计这只能是估计(除非知道真实的总体参数)。
标准误差公式
均值的标准误差是用标准差和样本量来计算的。
从公式中,你会看到样本量与标准误差成反比。这意味着样本越大,标准误差越小,因为样本统计量将更接近总体参数。
根据总体标准差是否已知,使用不同的公式。这些公式适用于含有超过20个元素的样本(n> 20)。
当总体参数已知时
当总体标准差已知时,可以在下面的公式中使用它来精确计算标准误差。
公式 | 解释 |
---|---|
|
当总体参数未知时
当总体标准差未知时,可以使用下面的公式仅估计标准误差。这个公式以样本标准差为a点估计总体标准差。
公式 | 解释 |
---|---|
|
首先,求出样本容量的平方根(n).
公式 | 计算 |
---|---|
|
接下来,将样本标准差除以第一步中发现的数字。
公式 | 计算 |
---|---|
|
SAT数学成绩的标准误差是12.8。
如何报告标准错误?
您可以报告标准误差与平均值或在置信区间来表达均值周围的不确定性。
报告标准误差的最佳方法是在置信区间中,因为读者不需要做任何额外的数学运算来得出有意义的区间。
置信区间是一个值的范围,其中未知的总体参数预计存在的大部分时间,如果你要重复你的研究与新的随机样本。
在95%置信水平下,所有样本均值的95%将被期望位于样本均值的±1.96标准误差的置信区间内。
基于随机抽样,真实的总体参数也在此范围内范围有95%的信心。
对于一个正态分布特征与SAT分数一样,95%的样本均值与样本均值相差约4个标准误差。
置信区间公式 | |
---|---|
CI=x̄±(1.96 ×SE) x̄=样本均值= 550 |
|
下限 | 上限 |
x̄−(1.96 ×SE) 550−(1.96 × 12.8) =525 |
x̄+ (1.96 ×SE) 550 +(1.96 × 12.8) =575 |
通过随机抽样,95% CI[525 575]告诉你,总体数学SAT平均分数在525和575之间的概率为0.95。
其他标准误差
除了平均值的标准误差(和其他统计数据)之外,你可能还会遇到另外两种标准误差:估计的标准误差和测量的标准误差。
的估计的标准误差与回归分析.这反映了估计回归线周围的可变性和回归模型的准确性。使用估计的标准误差,可以为真实回归系数构造一个置信区间。
的测量标准误差是关于可靠性在某种程度上。它表示测试的测量误差有多大变化,通常在标准化测试中报告。测量的标准误差可用于为元素或个人的真实得分创建置信区间。
关于标准错误的常见问题
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。