中位数|它是什么,你如何找到它?
的中位数是在对数据集进行排序时恰好位于数据集中间的值。这是一种度量集中趋势它将最低的50%值与最高的50%值分开。
找到中位数的步骤取决于你的数据点是奇数还是偶数。如果数据集中间有两个数字,则它们的的意思是是中位数。
中位数通常用于定量数据(其中值为数值),但有时也可以找到an的中位数序数数据集(其中的值是排名类别)。
用奇数数据集找到中位数
我们将使用一个周薪为5人的小样本数据集来完成步骤。
周薪(美元) | 350 | 800 | 220 | 500 | 130 |
---|
步骤1:从低到高排列这些值。
周薪(美元) | 130 | 220 | 350 | 500 | 800 |
---|
步骤2:计算中间位置。
使用公式 ,在那里n是数据集中的值的数量。
公式 | 计算 |
---|---|
|
中位数是在3日的位置。
步骤3:求中间位置的值。
周薪(美元) | 130 | 220 | 350 | 500 | 800 |
---|
周薪中位数是350美元。
用偶数数据集找到中位数
在偶数数据集中,数据集中间没有单个值,因此我们必须遵循稍微不同的过程。
让我们向数据集添加另一个值。现在你有6个值。
周薪(美元) | 350 | 800 | 220 | 500 | 130 | 1150 |
---|
步骤1:从低到高排列这些值。
周薪(美元) | 130 | 220 | 350 | 500 | 800 | 1150 |
---|
步骤2:计算中间的两个位置。
中间位置用公式求出来 而且 ,在那里n是数据集中的值的数量。
公式 | 计算 |
---|---|
|
|
|
中间值在3日而且4日的位置。
步骤3:找到中间的两个值。
周薪(美元) | 130 | 220 | 350 | 500 | 800 | 1150 |
---|
中间值为350而且500.
第四步:求两个中间值的平均值。
为了求中值,计算平均值把中间的值加起来再除以二。
这个数据集的周工资中位数是425美元。
求有序数据的中位数
中位数通常用于定量数据,这意味着数据集中的值是数值的。但有时你也可以确定中位数顺序数据.
有序数据按等级顺序组织成类别,例如语言能力水平(初级、中级或流利)或一致水平(非常同意、同意等)。
求中位数的过程几乎是一样的。
奇数的数据集
我们将详细介绍具有7个值的奇数序数数据集的步骤。
你将参与者的反应时间分为三组:慢、中、快。
首先,将所有值按升序排列。
反应速度 | 慢 | 慢 | 媒介 | 媒介 | 快 | 快 | 快 |
---|
接下来,使用查找中间值 ,在那里n是数据集中的值的数量。
公式 | 计算 |
---|---|
|
中位数是第4位的值。
反应速度 | 慢 | 慢 | 媒介 | 媒介 | 快 | 快 | 快 |
---|
反应速度的中值为媒介.
你能找到一个偶数序数数据集的中位数吗?
对于序数数据无法计算平均值,因此对于偶数数据集无法找到中位数。
例如,如果两个中间值分别为“慢”和“中”,则无法计算这些值的平均值。
在实践中,为了方便起见,有时会将序数数据转换为数值格式,并将其视为定量数据。然后可以计算中间值的平均值来找到中位数。
虽然这在某些情况下被认为是可以接受的,但并不总是被认为是正确的。
什么时候应该使用中位数?
中位数是最具信息量的衡量倾斜分布或分布的集中趋势离群值.
在倾斜分布中,更多的值落在中心的一边,而不是另一边,平均值、中位数和众数都彼此不同。
在一个积极倾斜分布,有一组较低的分数和一个分散的尾巴在右边。
在一个扭曲了分布上,有一群得分较高的人,左边有一条散开的尾巴。
因为中位数只使用数据集中间的一两个值,所以它不受极端离群值或分数的非对称分布的影响。相反,均值和众数的位置可以在倾斜分布中变化。
由于这个原因,中位数经常被报道为衡量收入等变量的集中趋势,因为这些分布通常是正倾斜的。
的测量水平变量的值也决定了你是否可以使用中位数。中位数只能用于可排序的数据——即从序数,时间间隔而且比测量水平。
关于中位数的常见问题
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。