如何找到一个数据集|公式和例子的范围
在统计学上,范围是分布中从最低值到最高值的数据分布。这是一种常用的测量方法可变性.
同时还有集中趋势,可变性的测量给你描述性统计用于总结数据集。
这个范围是用最高值减去最低值来计算的。虽然大范围意味着高变异性,但小范围意味着分布中的低变异性。
计算范围
计算范围的公式为:
- R=范围
- H最大值
- l最低值
范围是最容易计算的可变性度量。要找到范围,请遵循以下步骤:
- 将数据集中的所有值从低到高排序。
- 用最高值减去最低值。
不管你的值是正数还是负数,整数还是分数,这个过程都是一样的。
参与者 | 1 | 2 | 3. | 4 | 5 | 6 | 7 | 8 |
---|---|---|---|---|---|---|---|---|
年龄 | 37 | 19 | 31 | 29 | 21 | 26 | 33 | 36 |
首先,将值从低到高排序以识别最低值(l)和最高值(H).
年龄 | 19 | 21 | 26 | 29 | 31 | 33 | 36 | 37 |
---|
然后用最低值减去最低值。
R=H- - - - - -l
R=37- - - - - -19=18
数据集的范围是18年.
射程有用吗?
当你有一个没有极端值的分布时,范围通常给你一个很好的可变性指标。当与集中趋势的度量,范围可以告诉你分布的跨度。
但是这个范围可能会误导你离群值在你的数据集中。数据中的一个极值会给你一个完全不同的范围。
年龄 | 19 | 21 | 26 | 29 | 31 | 33 | 36 | 61 |
---|
使用相同的计算,我们得到了一个非常不同的结果:
R=H- - - - - -l
R= 61 - 19 =42
有一个异常值,我们的范围是42年.
在上面的例子中,范围表明数据中的可变性比实际情况要大得多。虽然我们有一个很大的范围,但大多数值实际上都集中在一个明确的中间。
因为只使用了两个数字,所以该范围很容易受到异常值的影响。它不能告诉你形状频率分布它本身的价值。
关于范围的常见问题
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。