四分位数|定义,计算和解释
四分位数是将已排序的数据分成四个部分的三个值,每个部分具有相等数量的观测值。四分位数是一种分位数.
- 第一四分位数:也称为Q1,或较低的四分位数。这是最小数和中间数之间的中间数。
- 第二个四分位数:也被称为Q2,或中位数.这是最小数和最大数之间的中间数。
- 第三四分位数:也称为Q3,或上四分位。这是中间数和最大值之间的中间数。
四分位数也可以拆分概率分布分成四部分,每一部分的概率相等。
什么是四分位数?
四分位数是一组描述性统计.他们总结了集中趋势而且可变性数据集或分布的。
四分位数是一种百分位.百分位数是指有一定百分比的数据低于该百分位数的值。一般来说,k%的数据低于k百分位。
- 的第一四分位数(Q1,或最低的四分位数)是第25个百分位数,这意味着25%的数据低于第一个四分位数。
- 的第二个四分位数(Q2,或中位数)是第50个百分位数,这意味着50%的数据低于第二个四分位数。
- 的第三四分位数(Q3,或上四分位数)是第75个百分位数,这意味着75%的数据低于第三个四分位数。
通过在第25、50和75个百分位数分割数据,四分位数将数据分为四个相等的部分。
如何找到四分位数
要查找数据集或样本的四分位数,请遵循下面的分步指南。
- 计算数据集中观测数据的数量(n).
- 将观测值从小到大排序。
- 求第一个四分位数:
- 计算n*(1 / 4)。
- 如果n*(1 / 4)为整数,则第一个四分位数为的意思是位置上的数字n*(1 / 4)和n*(1 / 4) + 1。
- 如果n*(1 / 4)为不整数,然后四舍五入。这个位置的数字是第一个四分位数。
- 求第二个四分位数:
- 计算n*(2 / 4)。
- 如果n*(2 / 4)是一个整数,第二个四分位数是位置上数字的平均值n*(2 / 4)和n*(2 / 4) + 1。
- 如果n*(2 / 4)为不整数,然后四舍五入。这个位置的数字是第二个四分位数。
- 求第三个四分位数:
- 计算n*(3 / 4)。
- 如果n*(3 / 4)是一个整数,那么第三个四分位数是位置上数字的平均值n*(3 / 4)和n*(3 / 4) + 1。
- 如果n*(3 / 4)为不整数,然后四舍五入。这个位置的数字是第三个四分位数。
有多种方法可以计算第一和第三四分位数,它们并不总是给出相同的答案。对于计算四分位数的最佳方法,目前还没有普遍的共识。
一步一步的例子
假设你对1-6岁儿童的语言发展进行了一项小型研究。你正在写一篇关于这项研究的论文,你想报告孩子们年龄的四分位数。
年龄(年) | 1 | 2 | 3. | 4 | 5 | 6 |
---|---|---|---|---|---|---|
频率 | 2 | 3. | 4 | 1 | 2 | 2 |
用箱形图可视化四分位数
箱线图是数据集的有用的可视化摘要。它们由盒子和胡须组成,盒子表示四分位数,胡须表示最低和最高的观测值。
要制作箱线图,首先需要计算five-number总结:
- 最低
- 这是最低级的观察。如果您将数据集中的数字从低到高排序,则最小值是第一个数字。最小值有时被称为第零分位数。
- 第一个四分位数
- 第二四分位数
- 第三个四分位数
- 的最大
- 这是最高的观察。如果将数据集中的数字从低到高排序,则最大值是最后一个数字。最大值有时被称为第四个分位数。
用这五个数字,你可以画一个箱线图:
这不是绘制箱形图的唯一方法。虽然方框总是表示四分位数,但通常胡须表示1.5位差Q1和Q3。
解释四分位数
四分位数可以为您提供有关观测或数据集的有用信息。
比较观察
四分位数有助于在样本或总体其余部分的背景下理解观察结果。通过将观测值与四分位数进行比较,可以确定观测值是位于底部25%、中间50%还是顶部25%。
中位数
第二个四分位数,更广为人知的是中位数,是衡量的尺度集中趋势.这个中间值可以很好地度量数据的平均值或最中心值,特别是对于倾斜或带有离群值.
四分位范围
第一和第三四分音之间的距离四分位范围(IQR) -是衡量可变性.它表示中间50%数据的分布。
IQR是一个特别好的测量倾斜分布或分布的变异性的方法离群值.IQR只包含中间50%的数据,所以不像范围, IQR不受极值的影响。
偏态
四分位数之间的距离可以提示一个分布是否正确倾斜或对称。最简单的方法是使用箱线图来查看四分位数之间的距离:
注意柱状图或偏态测量会给你一个更可靠的偏度指示。
识别异常值
四分位间距(IQR)可用于识别离群值.异常值是非常高或非常低的观测值。离群值的一个定义是任何距离第一或第三四分位数超过1.5 IQR的观测值。
什么是分位数?
四分位数是分位数的一种。
分位数是分割排序数据的值概率分布分成相等的部分。一般而言,a问-quantile将已排序的数据分为问部分。最常用的分位数有特殊的名称:
- 四分位数(4-quantiles):四分之一的数据分成四部分。
- 十分位数(10-quantiles): 9十分位数将数据分成10个部分。
- 百分位数(100 -分位数):99%的人将数据分成100个部分。
-
分位数总是比由分位数组成的部分少一个。
如何找到分位数
为了找到一个问-分位数,你可以跟a类似于用于四分位数的方法,除了步骤3-5,乘n乘以1/问而不是1/4。
例如,要找到第三个5分位数:
- 计算n*(3 / 5)。
- 如果n*(3 / 5)是一个整数,那么第三个5分位数是位置上数字的平均值n*(3 / 5)和n*(3 / 5) + 1。
- 如果n*(3 / 5)为不整数,然后四舍五入。这个位置的数字是第三个5分位数。
实践问题
有关四分位数和分位数的常见问题
- 如何在Excel中找到四分位数?
-
您可以使用QUARTILE()函数来查找四分位数在Excel中。如果您的数据在列A中,则单击任何空白单元格,为第一个四分位数键入“=QUARTILE(A:A,1)”,为第二个四分位数键入“=QUARTILE(A:A,2)”,为第三个四分位数键入“=QUARTILE(A:A,3)”。
- 如何找到R中的四分位数?
-
您可以使用quantile()函数来查找四分位数如果你的数据被称为“data”,那么“quantile(data, prob=c(.25,.5,.75), type=1)”将返回三个四分位数。
- 如何找到概率分布的四分位数?
-
要找到四分位数对于概率分布,你可以使用分布的分位数函数。
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。