峰度是什么?定义,例子和公式

峰度是分布尾性的度量。尾态是指异常值出现的频率。过度峰度分布的尾尾是相对于a的吗正态分布

尾巴是分布两侧的锥形端点。它们代表了与平均值相比极高或极低的值的概率或频率。换句话说,反面代表频率离群值发生。

示例:峰度的类型

偏度和峰度的区别

峰度的类型

分布可以根据峰度分为三组:

类别
常峰态的 低峰态 尖峰的
Tailedness Medium-tailed 瘦尾 厚尾
离群值的频率 媒介
峰度 中(3) 低(< 3) 高(> 3)
过度峰度 0 积极的
示例分布 正常的 统一的 拉普拉斯

什么是中库质分布?

一个常峰态的分布是中尾的,所以离群值既不是高频次,也不是高不频次。

峰度是通过比较来测量的正态分布

  • 正态分布的峰度为3,因此任何峰度约为3的分布都是中库态分布。

峰度通常用过度峰度,即峰度−3。由于正态分布的峰度为3,过多的峰度使得将分布的峰度与正态分布进行比较更加容易:

  • 正态分布的过量峰度为0,因此任何过量峰度约为0的分布都是中库态分布。

中库分布的例子

平均在美国,一只雌象宝宝出生时重达210磅。假设一位动物学家对大象出生体重的分布感兴趣,所以她联系了世界各地的动物园和保护区,要求他们分享他们的数据。她收集了400只雌性小象的出生体重数据:

常峰态的例子

从图表中,我们可以看到频率分布(灰色条所示)近似服从正态分布(绿色曲线所示)。正态分布为中库态分布。

动物学家计算样本的峰度。她发现峰度为3.09,过剩峰度为0.09,她得出的结论是,分布是中库态的。

请注意
尽管人口概率分布可以有一个峰度正好为3,实际数据几乎总是至少略有平峰度或细峰度。如果一个样本峰度约为3,你可以假设它是从中库种群中提取的。

中库分布有离群值这既不是非常频繁,也不是非常罕见,大象出生体重就是这样。偶尔,雌象宝宝出生时的体重会小于180磅或超过240磅。

防止抄袭,运行免费检查。

免费尝试

什么是platykurtic分布?

一个低峰态分布是薄尾的,这意味着异常值很少出现。

Platykurtic分布的峰度小于a正态分布.换句话说,平库分布具有:

  • 峰度小于3
  • 小于0的过量峰度

Platykurtosis有时被称为负峰态,因为过剩峰度为负。

请注意
“platykurtosis”中的“platy”来自希腊单词platus,意思是平的。虽然许多红石分布有一个平坦的峰值,一些红石分布有一个尖峰。统计学家现在明白峰度是一种度量tailedness,而不是“峰顶”。

记住" platykurtic "意思的一个技巧是,想象一只鸭嘴兽有一条细尾巴。

Platykurtic分布的例子

一位社会学家正在研究一所小型高中学生使用社交媒体的情况。学校有400名学生,不等在14岁到18岁之间:

低峰态分布

频率分布(灰色条所示)并不遵循正态分布(由绿色虚线所示)。相反,它近似地遵循均匀分布(如紫色曲线所示)。均匀分布为扁石分布。

社会学家计算出样本的峰度为1.78,其多余峰度为−1.22。他的结论是,这种分布是平库的。

的低频率分布离群值.均匀分布,如学生年龄分布,是平库分布的极端情况,因为异常值是如此罕见,以至于完全不存在。没有小于14岁或大于18岁的学生。

请注意
在上图中,注意分布的最左边和最右边——尾部——均匀分布曲线下面的空间(紫色)比正态分布曲线下面的空间(绿色)要薄。这就是所谓的“细尾巴”。

什么是细峰分布?

一个尖峰的分布是长尾分布,这意味着有很多异常值。

细峰分布比正态分布更峰化。他们有:

  • 峰度大于3
  • 超过0的过量峰度

峰度轻症有时被称为正峰态,因为过剩峰度为正。

请注意
“leptokurtosis”中的“lepto”来自希腊单词leptos,意思是狭窄。就像峰度症一样,这是一个用词不当因为它用峰度来定义峰度,而不是tailedness

记住“leptokurtic”意思的一个技巧是想象一只长着肥尾巴的跳跃的袋鼠。

细峰分布的例子

想象一下,四位天文学家都在试图测量地球和天龙座Nu2 A之间的距离,Nu2是天龙座的一颗蓝色恒星。四位天文学家都测量了100次距离,并将他们的数据放在同一个数据集中:

尖峰的分布

频率分布(灰色条所示)并不遵循正态分布(绿色虚线所示)。相反,它近似地遵循拉普拉斯分布(如蓝色曲线所示)。拉普拉斯分布是细峰分布。

天文学家计算出样本的峰度为6.54,其多余峰度为3.54。他们得出结论,该分布是细峰状的。

细峰分布有频繁的异常值。天文学家的测量值的分布比你想象的要多,如果分布是正常的,有几个极端的观测值小于50光年或超过150光年。

请注意
如果你仔细观察上面的图表,你会注意到在分布的最左边和最右边——尾部——拉普拉斯分布曲线下面的空间(蓝色)比正态分布曲线下面的空间(绿色)略厚。这就是所谓的“肥尾巴”。

如何计算峰度

从数学上讲,峰度是标准化的第四种时刻分布的。力矩是一组测量值,可以告诉你分布的形状。

矩通过除以标准偏差取适当的幂。

总体的峰度

下面的公式描述了a的峰度人口

{方程*}\ \开始textup{峰度}= \波浪号{\μ}_4 = \ dfrac {\ mu_4}{\σ^ 4}\{方程*}结束

地点:

  • \波浪号{\μ}_4 是标准化的四阶矩吗
  • \ mu_4 非标准化的中心第四矩
  • \σ 是标准差

样本的峰度

样本的峰度是估计总体的峰度。

用样本的四阶矩除以其标准差的四次方来计算样本的峰度似乎很自然。然而,这导致了一个有偏见的估计。

多余峰度的无偏估计公式包括一个基于样本量的冗长修正:

\开始{方程*}\ textup{峰度}= \ dfrac {(n + 1) n (n - 1)} {(n - 1) (n)} \ dfrac{\总和{酒吧(x_i - \ {x}) ^ 4}}{总和(\{酒吧(x_i \ {x}) ^ 2}) ^ 2} 3 \ dfrac {(n - 1) ^ 2} {(n - 2) (n)} \{方程*}结束

在哪里

  • n 是样本量
  • x_i 是对变量的观察吗x
  • 酒吧\ {x} 的意思是变量的x

    手工计算峰度很费时。因此,大多数人使用计算机软件来计算它。例如,库尔特()函数用上面的公式计算峰度。

    峰度的常见问题

    偏度和峰度的区别是什么?

    偏态而且峰度两者都是衡量分布形状的重要指标。

    • 偏态测量分布的不对称性。
    • 峰度测量分布尾部相对于分布尾部的重量正态分布

    偏度和峰度的区别

    峰度的三种类型是什么?

    这三个类别峰度是:

    • 正态峰多余峰度为0。正态分布常峰态的。
    • 低峰态一个负的过剩峰度。扁石分布是薄尾分布,这意味着它们的数量很少离群值
    • 峭度一个正的过剩峰度。细峰分布是肥尾分布,这意味着它们有许多异常值。
    什么是正态分布?

    在一个正态分布,数据对称分布,无歪斜。大多数值都聚集在一个中心区域周围,当值离中心越远时,值就越小。

    集中趋势的度量(均值、众数和中位数)在正态分布中完全相同。

    正态分布

    引用这篇Scribbr文章

    如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

    特尼,S.(2022年11月10日)。峰度是什么?定义,例子和公式。Scribbr。检索于2022年12月16日,来自//www.charpingshvac.com/statistics/kurtosis/

    这篇文章有用吗?
    肖恩·特尼

    在他的硕士和博士期间,Shaun学习了如何将科学和统计方法应用到他的生态学研究中。现在,他喜欢教学生如何为他们自己的论文和研究项目收集和分析数据。
    Baidu