标准正态分布|示例,解释,使用
的标准正态分布,也叫z分布,是一个特别的正态分布在哪里的意思是为0,而标准偏差是1。
任何正态分布都可以通过将其值转换为z分数。Z分数告诉你每个值离平均值有多少个标准差。
把正态分布转换成az-distribution允许你计算某些值出现的概率,并比较不同的数据集。
正态分布和标准正态分布
所有正态分布,和标准正态分布一样单峰并呈钟形曲线对称分布。然而,正态分布可以取任何值作为其均值和标准差。在标准正态分布中,均值和标准差总是固定的。
每个正态分布都是标准正态分布的一个版本它被拉伸或挤压并水平向左或向右移动。
均值决定了曲线的中心。增加均值使曲线向右移动,而减少均值使曲线向左移动。
标准差会拉伸或挤压曲线。标准差小,曲线窄,标准差大,曲线宽。
曲线 | 位置或形状(相对于标准正态分布) |
---|---|
一个(米= 0,SD= 1) | 标准正态分布 |
B (米= 0,SD= 0.5) | 挤,因为SD< 1 |
C (米= 0,SD= 2) | 拉伸,因为SD> 1 |
D (米= 1,SD= 1) | 右移,因为M > 0 |
E (米= 1,SD= 1) | 左移,因为米< 0 |
标准化正态分布
对正态分布进行标准化时,均值变为0,标准差变为1。这允许您轻松计算某些值在分布中出现的概率,或比较具有不同均值和标准差的数据集。
而数据点被称为x在正态分布中,它们被称为z或z得分在z分布。一个z分数是一个标准分数它告诉你一个个体值(离均值有多少个标准差远)x):
- 一个积极的z分数意味着你的x值大于平均值。
- 一个负z分数意味着你的x值小于平均值。
- 一个z零分意味着你的x值等于平均值。
转换正态分布进入标准正态分布允许你:
- 比较在不同分布上的得分,使用不同的均值和标准差。
- 标准化统计决策的分数(例如,曲线评分)。
- 求分布中高于或低于给定值的观测值的概率。
- 求a的概率样本均值与已知总体均值有显著差异。
如何计算z分数
要将正态分布中的值标准化,请将单个值转换为z得分:
- 从你的个人价值中减去平均值。
- 将差值除以标准差。
Z得分公式 | 解释 |
---|---|
|
要标准化数据,首先要找到z1380分。的z分数表示1380离均值有多少个标准差。
第一步:减去平均值从x价值。 | x= 1380 米= 1150 x- - - - - -米= 1380−1150 = 230 |
---|---|
第二步:将差值除以标准差。 | SD= 150 z= 230 ÷ 150 = 1.53 |
的z分数为13801.53.这意味着1380是分布均值的1.53个标准差。
接下来,我们可以用a来求这个分数的概率z表格
用标准正态分布求概率
标准正态分布是a概率分布,所以两点之间曲线下的面积告诉你变量取一定范围值的概率。曲线下的总面积是1或100%
每一个z分数有一个相关的p价值它告诉你所有低于或高于这个值的概率z分数发生。这是曲线左边或右边的面积z得分。
Z测试和p值
的z分数是检验统计量用于z测验.的z测试用于比较两组的平均值,或将一组的平均值与一个设定值进行比较。它的零假设通常假设组之间没有差异。
曲线下a右边的面积z分数是p值,它是零假设成立时观察结果发生的可能性。
通常,一个p0.05或更小的值意味着你的结果不太可能是偶然出现的;这表明有统计学意义的影响。
通过将正态分布中的值转换为az分数,你可以很容易地找到p值为z测试。
如何使用z表
一旦你有了z分数,可以在a中查找相应的概率z表格.
在一个z表,曲线下的面积报告为每z值在-4和4之间,间隔为0.01。
有几种不同的格式z表格这里,我们使用了累积表的一部分。这个表格告诉你到某一给定点为止曲线下的总面积z分数——这个面积等于低于这个值的概率z分数发生。
a的第一列z表包含z一直算到小数点后第一位。表的第一行给出了小数点后的第二位。
要找到z分数曲线下的对应区域(概率):
- 走到你的前两位数字所在的那行z得分。
- 翻到第三位和你的一样的那一列z得分。
- 从前面的步骤中找到行和列的交点处的值。
的逐步示例z分布
让我们通过一个虚构的研究例子来更好地理解标准正态分布是如何工作的。
作为一名睡眠研究人员,你很好奇在COVID-19封锁期间睡眠习惯是如何变化的。收集睡眠持续时间数据样本在全面封锁期间
在封锁之前,人口的平均睡眠时间为6.5小时。锁定样本均值为7.62。
为评估样本均值是否与封锁前总体均值显著不同,可执行z测验:
- 首先,计算az样本均值得分。
- 然后,你找到p你的价值z使用z表格
第一步:计算az分数
若要比较锁定期间和锁定前的睡眠时长,可将锁定样本均值转换为z使用封锁前总体均值和标准差进行评分。
公式 | 解释 | 计算 |
---|---|---|
x样本平均数 μ =总体平均数 σ =总体标准差 |
|
一个z得分为2.24意味着样本均值比总体均值大2.24个标准差。
第二步:找到p价值
求样本均值的概率z低于2.24分的情况下,使用z表查找第2.2行和+0.04列的交集处的值。
这个表格告诉你曲线下的面积,在你的z得分为0.9874。这意味着你的样本的平均睡眠时间高于封锁前人口的平均睡眠时间约98.74%。
要找到p值来评估样本是否与总体不同,您计算曲线上方或z分数右侧的面积。因为曲线下的总面积是1,减去曲线下的面积z从1开始得分。
一个p小于0.05或5%的值表示样本与总体有显著差异。
的概率z> 2.24 = 1−0.9874 =0.0126或1.26%
与一个p值小于0.05,则可以得出结论,COVID-19封锁期间的平均睡眠时长明显高于封锁前的平均时长。
关于标准正态分布的常见问题
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。