t分布|它是什么以及如何使用它(附示例)

t-分布,也称为学生分布t-分布,是一种描述数据的方法,当在图形上绘制时,数据遵循钟形曲线,最大数量的观测值接近的意思是尾部的观察结果更少。

这是一种正态分布用于较小的样本量,其中方差在数据上是未知的。

t分布遵循钟形曲线,最有可能的观测值接近平均值,而尾部的观测值不太可能。

在统计学上,t-distribution最常用于:

    什么是t分布?

    t-分布是一种正态分布,用于较小的样本容量。正态分布数据在图上绘制时形成钟形,在均值附近有更多的观测值,在尾部有更少的观测值。

    t-distribution用于数据为正态分布,这意味着数据遵循钟形,但总体方差未知。a的方差t-分布的估计基于自由度的数据集(观察总数减去1)。

    这是一种更为保守的形式标准正态分布,也被称为z分布。这意味着,与标准正态分布相比,中心的概率更低,尾部的概率更高。

    例子:t分布和z分布
    如果你从只有20个学生的样本中测量平均考试成绩,你应该使用t分布估计均值附近的置信区间。如果你使用z分布时,您的置信区间将被人为地精确。

    基于样本方差的t分布和样本容量为20的z分布(又称标准正态分布)的比较。

    T-分布和标准正态分布

    随着自由度(观测总数减去1)增加,则t-分布将越来越接近于标准正态分布,也就是z-分布,直到它们几乎完全相同。

    在30个自由度以上t-distribution大致匹配z分布。因此,z-distribution可以用来代替t-大样本量分布。

    z-distribution优于t-分布,因为它有一个已知的方差。它可以做出更精确的估计t-分布,其方差近似使用数据的自由度。

    学生在1,3,8,20个自由度下的t分布,和z分布的比较。

    以下是学生们喜欢Scribbr校对服务的原因

    发现校对和编辑

    T分布和t分数

    一个t-score是的个数标准差从a的均值t分布。你可以查at在a中得分t,或使用网上服务t分数计算器。

    在统计数据,t-分数主要用于发现两件事:

    1. 当数据近似正态分布时,置信区间的上下界。
    2. p测试统计量的值t-测试和回归测试。

    T-分数和置信区间

    置信区间的使用t-scores来计算预测区间的上下界。的t-score用于生成上界和下界,也称为临界值t,或t*。

    置信区间的例子
    您从两个不同的班级抽取了20名学生,以估计标准化考试的平均分数,并想知道两组之间是否存在差异。

    使用双尾t-test,您将生成两个类之间差异的估计值以及围绕该估计值的置信区间。从t-test你发现班级1和班级2之间的平均分的差异是4.61,95%置信区间为3.87到5.35。

    因为置信区间不跨越零,实际上离零还很远,在测试分数上的这种差异不太可能发生在零假设两组之间没有差异。

    显示95%置信区间的上界和下界的t分布。

    T分数和p

    统计测试生成检验统计量显示出你的数据离统计检验的零假设有多远。然后计算出p价值它描述了零假设成立时数据出现的可能性。

    的检验统计量t测试而且回归测试t分数。而大多数统计程序会自动计算出相应的数值p-valuet-score,你也可以在a中查找值t-table,使用自由度和t-score来查找p价值。

    t生成一个p-value低于您的阈值统计显著性是已知的临界值t,或t*。

    p值的例子
    的双尾t-test测试分数的差异生成一个t-value为12.79。这意味着群体均值的差值与原假设分布的均值相差12.79个标准差。

    自由度为38(每组n-1)。在一个t-table(或者在你最喜欢的统计程序中计算它),你会发现一个p-value < 0.001。

    这一发现,就像置信区间的发现一样,表明如果平均考试分数的真实差异为零,则不太可能发现如此大的差异。

    关于t分布的常见问题

    t分布是什么?

    t分布是一种描述一组观测结果的方法吗的意思是,其余的观测组成了两边的尾巴。这是一种正态分布用于较小的样本量,其中方差在数据上是未知的。

    t分布在图上形成钟形曲线。它可以用均值和标准偏差

    t分布和标准正态分布的区别是什么?

    t分布对分布尾部的观测结果的概率大于标准正态分布(又名z分布)。

    这样,t-分布比标准正态分布更保守:达到相同的置信度或统计显著性,你将需要包括更广泛的数据。

    什么是t分数?

    一个t-score(又名:得分t的均值的标准差数)t分布

    t-score是检验统计量中使用的t测试而且回归测试。它也可以用来描述当数据遵循a时,观察值离均值有多远t分布。

    什么是检验统计量?

    一个检验统计量一个数字是由a计算出来的吗统计检验.它描述了你观测到的数据距离零假设没有关系变量或者说样本组之间没有差异。

    检验统计量告诉您两个或多个组与总体有多大不同的意思是,或线性斜率与由a预测的斜率有多大不同零假设.在不同的统计检验中使用不同的检验统计量。

    什么是临界值?

    的值检验统计量定义的上界和下界置信区间,或定义的阈值统计显著性在统计测试中。它描述了你必须离分布的均值有多远才能覆盖数据中的总变异量(即90%,95%,99%)。

    如果您正在构建一个95%置信区间,并使用统计显著性阈值为p= 0.05,则两种情况下的临界值是相同的。

    引用这篇Scribbr文章

    如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

    Bevans, R.(2022年7月09日)。t分布|它是什么以及如何使用它(附示例)。Scribbr。检索自//www.charpingshvac.com/statistics/t-distribution/, 2022年12月24日

    这篇文章有用吗?
    丽贝卡·贝

    丽贝卡正在攻读土壤生态学博士学位,空闲时间用来写作。她很高兴能和大家一起研究统计数据。
    Baidu