峰度是什么?定义,例子和公式
峰度是分布尾性的度量。尾态是指异常值出现的频率。过度峰度分布的尾尾是相对于a的吗正态分布.
尾巴是分布两侧的锥形端点。它们代表了与平均值相比极高或极低的值的概率或频率。换句话说,反面代表频率离群值发生。
示例:峰度的类型
峰度的类型
分布可以根据峰度分为三组:
类别 | |||
---|---|---|---|
常峰态的 | 低峰态 | 尖峰的 | |
Tailedness | Medium-tailed | 瘦尾 | 厚尾 |
离群值的频率 | 媒介 | 低 | 高 |
峰度 | 中(3) | 低(< 3) | 高(> 3) |
过度峰度 | 0 | 负 | 积极的 |
示例分布 | 正常的 | 统一的 | 拉普拉斯 |
什么是中库质分布?
一个常峰态的分布是中尾的,所以离群值既不是高频次,也不是高不频次。
峰度是通过比较来测量的正态分布.
- 正态分布的峰度为3,因此任何峰度约为3的分布都是中库态分布。
峰度通常用过度峰度,即峰度−3。由于正态分布的峰度为3,过多的峰度使得将分布的峰度与正态分布进行比较更加容易:
- 正态分布的过量峰度为0,因此任何过量峰度约为0的分布都是中库态分布。
中库分布的例子
在平均在美国,一只雌象宝宝出生时重达210磅。假设一位动物学家对大象出生体重的分布感兴趣,所以她联系了世界各地的动物园和保护区,要求他们分享他们的数据。她收集了400只雌性小象的出生体重数据:
从图表中,我们可以看到频率分布(灰色条所示)近似服从正态分布(绿色曲线所示)。正态分布为中库态分布。
动物学家计算样本的峰度。她发现峰度为3.09,过剩峰度为0.09,她得出的结论是,分布是中库态的。
中库分布有离群值这既不是非常频繁,也不是非常罕见,大象出生体重就是这样。偶尔,雌象宝宝出生时的体重会小于180磅或超过240磅。
什么是platykurtic分布?
一个低峰态分布是薄尾的,这意味着异常值很少出现。
Platykurtic分布的峰度小于a正态分布.换句话说,平库分布具有:
- 峰度小于3
- 小于0的过量峰度
Platykurtosis有时被称为负峰态,因为过剩峰度为负。
Platykurtic分布的例子
一位社会学家正在研究一所小型高中学生使用社交媒体的情况。学校有400名学生,不等在14岁到18岁之间:
的频率分布(灰色条所示)并不遵循正态分布(由绿色虚线所示)。相反,它近似地遵循均匀分布(如紫色曲线所示)。均匀分布为扁石分布。
社会学家计算出样本的峰度为1.78,其多余峰度为−1.22。他的结论是,这种分布是平库的。
的低频率分布离群值.均匀分布,如学生年龄分布,是平库分布的极端情况,因为异常值是如此罕见,以至于完全不存在。没有小于14岁或大于18岁的学生。
什么是细峰分布?
一个尖峰的分布是长尾分布,这意味着有很多异常值。
细峰分布比正态分布更峰化。他们有:
- 峰度大于3
- 超过0的过量峰度
峰度轻症有时被称为正峰态,因为过剩峰度为正。
细峰分布的例子
想象一下,四位天文学家都在试图测量地球和天龙座Nu2 A之间的距离,Nu2是天龙座的一颗蓝色恒星。四位天文学家都测量了100次距离,并将他们的数据放在同一个数据集中:
频率分布(灰色条所示)并不遵循正态分布(绿色虚线所示)。相反,它近似地遵循拉普拉斯分布(如蓝色曲线所示)。拉普拉斯分布是细峰分布。
天文学家计算出样本的峰度为6.54,其多余峰度为3.54。他们得出结论,该分布是细峰状的。
细峰分布有频繁的异常值。天文学家的测量值的分布比你想象的要多,如果分布是正常的,有几个极端的观测值小于50光年或超过150光年。
如何计算峰度
从数学上讲,峰度是标准化的第四种时刻分布的。力矩是一组测量值,可以告诉你分布的形状。
矩通过除以标准偏差取适当的幂。
总体的峰度
下面的公式描述了a的峰度人口:
地点:
- 是标准化的四阶矩吗
- 非标准化的中心第四矩
- 是标准差
样本的峰度
样本的峰度是估计总体的峰度。
用样本的四阶矩除以其标准差的四次方来计算样本的峰度似乎很自然。然而,这导致了一个有偏见的估计。
多余峰度的无偏估计公式包括一个基于样本量的冗长修正:
在哪里
- 是样本量
- 是对变量的观察吗
- 是的意思是变量的
手工计算峰度很费时。因此,大多数人使用计算机软件来计算它。例如,库尔特()函数用上面的公式计算峰度。
峰度的常见问题
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。