模式|它是什么,你是如何找到它的?
的模式或者数据集的模态值是最常出现的值。这是一种度量集中趋势这告诉你最受欢迎的选择或你最常见的特点样本.
当报道描述性统计,集中趋势的度量可以帮助您找到数据集的中间值或平均值。集中趋势的三种最常见的测量方法是模式,中位数,的意思是.
你可以有多少种模式?
一个数据集通常可以没有模态、一个模态或多个模态——这完全取决于有多少不同的值重复频率最高。
你的数据可以是:
- 没有任何模式
- 单峰,在一种模式下,
- 双峰,有两种模式,
- 三峰,有三种模式,或者
- 多通道,四种或更多模式。
找到模态
要找到模式,请遵循以下两个步骤:
- 如果数据为您变量采用数值形式,数值从低到高排序。如果采用类别或分组的形式,则按组对值进行排序。
- 确定出现频率最高的值。
数值模式示例
你的数据集是6岁的大学生。
参与者 | 一个 | B | C | D | E | F |
---|---|---|---|---|---|---|
年龄 | 19 | 22 | 20. | 21 | 22 | 23 |
通过将值从低到高排序,我们可以很容易地看到出现频率最高的值。
年龄 | 19 | 20. | 21 | 22 | 22 | 23 |
---|
这个数据集的模态是22.
分类模式示例
你的数据集包含了参与者父母的最高教育水平。
参与者 | 一个 | B | C | D | E | F |
---|---|---|---|---|---|---|
父母受教育程度 | 学士学位 | 硕士学位 | 高中学历 | 学士学位 | 博士学位 | 硕士学位 |
要按组对值排序,可以创建一个简单的频率表。把类别放在左边,频率放在右边。
父母受教育程度 | 频率 |
---|---|
学士学位 | 2 |
硕士学位 | 2 |
高中学历 | 1 |
博士学位 | 1 |
从表中可以看到有两种模式。这意味着你有一个双峰数据集。
模式是学士学位而且硕士学位.
求分组数据的模态
分组频率表将大型数值数据集组织成值的间隔或类,并报告每个类中的值的频率。
对于分组数据,可以通过两种方式报告模式:
- 的模态类值出现频率最高的分组。
- 的最常见的值估计为模态类的中点。
在这种情况下,模态只是一个估计值,因为模态类中的实际值是未知的。
模态类和模态值示例
你有一个数据集,其中包括参与者的平均反应时间。将数据组织到一个频率表中。
反应时间以100毫秒为单位。频率列显示每个班级的参与者数量。
反应时间(毫秒) | 频率 |
---|---|
200 - 299 | 6 |
300 - 399 | 13 |
400 - 499 | 17 |
500 - 599 | 25 |
600 - 699 | 21 |
700 - 799 | 12 |
800 - 899 | 4 |
您可以通过在直方图上绘制数据来可视化数据集。模式是直方图或柱状图中峰值最高的值。
从你的表格或柱状图中,你可以看到模态类-值出现频率最高的组-是500 - 599毫秒.因此,模态估计在这个类的中点:550毫秒.
重要的是,分组数据中间隔的选择对模式有很大的影响。例如,将间隔从100毫秒长更改为50或200毫秒长可能会导致完全不同的模式。
何时使用该模式
的测量水平你的变量决定了你什么时候应该使用模式。
该模式最适用于分类数据。这是唯一的集中趋势的衡量名义上的变量,它可以反映最常见的特征(例如,人口统计信息)。该模式也适用于序数变量——例如,在分级量表上反映最受欢迎的答案(例如,同意程度)。
对于定量数据,如反应时间或高度,模式可能不是集中趋势的有用测量。这是因为定量数据通常比分类数据有更多的可能值,所以值不太可能重复。
没有模式的定量数据示例
您在计算机任务中收集有关反应时间的数据,您的数据集包含彼此不同的值。
反应时间(毫秒) | 267 | 345 | 421 | 324 | 401 | 312 | 382 | 298 | 303 |
---|
在这个数据集中,没有模式,因为每个值只出现一次。
关于模式的常见问题
- 可以有多个模式吗?
-
一个数据集通常可以没有模态、一个模态或多个模态——这完全取决于有多少不同的值重复频率最高。
你的数据可以是:
- 没有任何模式
- 单模态,只有一个模式,
- 双峰,有两种模式,
- 三模态,有三模态,或者
- 多模式,具有四种或更多模式。
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。