序数数据|定义,示例,数据收集与分析

顺序数据在一个变量它们有一个自然的等级顺序。然而,类别之间的距离是不均匀的或未知的。

例如,可变的“体育锻炼频率”可以分为以下几类:

1.从来没有 2.很少 3.有时 4.经常 5.总是

这些类别有一个明确的顺序,但我们不能说“从不”和“很少”之间的区别与“有时”和“经常”之间的区别完全相同。因此,这个刻度是序数。

测量水平

序数是4个等级中的第二个测量水平:标称、序号、间隔和比例。测量的级别表示记录数据的精确程度。

而名义变量和序数变量是分类, interval和比例变量是定量的。

测量的4个级别:名义、顺序、间隔和比率

名义上的数据与序号数据不同,因为它不能按顺序排序。间隔的数据与序号数据不同,因为相邻分数之间的差异是相等的。

序数尺度的例子

在社会科学研究中,序数变量通常包括关于意见或看法的评级,或被分为等级或等级(如社会地位或收入)的人口因素。

变量 顺序值
语言能力
  • 初学者
  • 中间
  • 流利的
认同程度
  • 强烈反对
  • 不同意
  • 既不同意也不反对
  • 同意
  • 强烈同意
收入水平
  • 低层收入
  • 中层收入
  • 上层收入

防止抄袭,运行免费检查。

免费尝试

如何收集有序数据

序数变量通常使用封闭式方法进行评估调查给参与者几个可能的答案供他们选择的问题。这些都是用户友好的,可以让您轻松地比较参与者之间的数据。

序数量表调查问题的例子
问题 选项
你多大了?
  • 0-18
  • 19-34
  • 35-49
  • 50 +
你的教育程度是多少?
  • 小学
  • 高中
  • 学士学位
  • 硕士学位
  • 博士学位
在过去的三个月里,你在网上买过几次杂货?
  • 没有一个
  • 1 - 4次
  • 5 - 9倍
  • 10 - 14倍
  • 15次或以上

选择测量水平

某些类型的数据可以记录在多个级别上。例如,对于年龄变量:

  • 你可以通过要求参与者从四个年龄段中进行选择来收集有序数据,就像上面的问题一样。
  • 你可以收集比数据通过询问参与者的确切年龄。

更精确的水平总是可取的收集数据因为它允许你执行更多的数学运算和统计分析。

李克特量表数据

在社会科学中,经常使用序数数据来收集李克特量表.李克特量表由4个或更多李克特类型的问题组成,有连续的回答项目供参与者选择。

李克特型问题的例子
你多久买一次节能产品?
从来没有 很少 有时 经常 总是
你认为减少碳足迹有多重要?
不重要 稍微重要 重要的 比较重要的 非常重要的

由于这些值有一个自然的顺序,它们有时被编码成数值。例如,1 =从不,2 =很少,3 =有时,4 =经常,5 =总是。

但需要注意的是,并不是所有的数学运算都可以在这些数字上执行。尽管您可以说数据集中的两个值相等或不相等(=或≠),或者一个值大于或小于另一个(<或>),则不能有意义地相互添加或减去值。

在收集关于数据的描述性统计信息时,这就变得很重要。

如何分析序数数据

序数据可以用描述性和推论统计

描述性统计

你可以用这些描述性统计对于序数数据:

例子
你要求30名调查参与者表明他们对以下陈述的认同程度:

有规律的体育锻炼对我的心理健康很重要。
强烈反对 不同意 既不同意也不反对 同意 强烈同意

要获得数据的概览,您可以创建一个频率分布表,告诉您每个响应被选择了多少次。

例如:频率分布表
协议层 频率
强烈反对 2
不同意 2
既不同意也不反对 8
同意 13
强烈同意 5

要使数据可视化,可以将其显示在条形图上。把类别标在x轴上频率标在y轴上。

与标称数据不同,在显示序号数据时,类别的顺序很重要。

示例:柱状图
在条形图上可视化有序数据

集中趋势

集中趋势你的数据集是你的大部分价值所在。众数、平均值和中位数是最常用的三种集中趋势的度量

模式几乎总是可以在序数数据中找到中位数只能在某些情况下找到。

平均值不能用序号数据计算。求均值要求您对数据集中的值执行加法和除法等算术操作。由于相邻分数之间的差异是未知的序数数据,这些操作不能执行有意义的结果。

例如:查找模式
数据的模式是最常出现的值。

在当前数据集中,模式为同意

奇数和偶数数据集的中位数有不同的方法。

  • 在奇数数据集中,中位数是对数据集进行排名时位于数据集中间的值。
  • 在偶数数据集中,中位数是数据集中中间两个值的平均值。
示例:求中值
对所有数据值进行排序,并在数据集的中间位置找到中位数。

因为有30个值,所以在15和16个位置有2个值在中间。这两个值是相同的,所以中位数是同意

现在,假设中间的两个值是Agree和strong Agree。如何求这两个值的均值呢?

由于加法或除法是不可能的,所以即使用数字编码,也无法找到这两个值的平均值。这里没有中位数。

可变性

评估可变性在你的数据集中,你可以找到最小值,最大值和范围。您需要对这些数据进行数字编码。

示例:查找范围
首先,通过给每个响应分配一个数字来编码你的数据,从低到高:

  • 1 =完全不同意
  • 2 =不同意
  • 既不同意也不同意
  • 4 .同意
  • 5 .非常同意

要找到最小值和最大值,请查找数据集中出现的最小值和最大值。最小值为1,最大值为5。

对于范围,用最大值减去最小值:

范围= 5 - 1 =4

这个范围可以让你大致了解你的分数之间有多大的差异。从这些信息中,你可以得出结论,在天平的两端至少有一个答案。

统计测试

推论统计帮助您测试科学假设关于你的数据。最合适的统计测试对于顺序数据,重点关注测量的排名。这些是非参数检验。

参数测试用于当数据满足某些条件时,例如正态分布.参数检验评估平均值,而非参数检验通常评估中位数或秩。

对于序数数据,可以使用许多可能的统计测试。你选择哪一个取决于你的目标和数量和类型样品

非参数检验 目的 样本或变量 例子
情绪中位数检验 比较中位数 2个或以上样本 两个相邻城市的居民收入中值有多大不同?
Mann-WhitneyU检验(Wilcoxon秩和检验) 比较分数的排名和 2个独立样本 一个城市的社会地位与另一个城市有什么不同?
Wilcoxon配对符号秩检验 比较分数分布之间差异的大小和方向 2个依赖样本 在同一个城市,民主党人和共和党人的收入水平分布有多相似?
克鲁斯卡尔-沃利斯H测验 比较分数的平均排名 3个或以上样本 民主党人、共和党人和无党派人士对社会地位的看法有何不同?
斯皮尔曼相关系数或秩相关系数 将两个变量关联起来 2个序数变量 收入水平与社会地位有关吗?

关于序数数据的常见问题

什么是序数数据?

顺序数据具有两个特点:

  • 数据可以在一个变量内划分为不同的类别。
  • 这些类别有一个自然的排名顺序。

然而,与间隔数据不同,类别之间的距离是不均匀的或未知的。

测量的四个层次是什么?

测量水平告诉你变量的记录有多精确。有4个等级的测量,可以从低到高的排名:

  • 名义上的数据只能进行分类。
  • 序数可以对数据进行分类和排序。
  • 时间间隔可以对数据进行分类和排序,并均匀间隔。
  • 数据可以被分类,排序,均匀间隔,并有一个自然的零。
标称数据和序号数据的区别是什么?

名义和序数是四种中的两种测量水平标称液位数据只能保密,而序数级数据可以分类和排序。

序数变量是分类变量还是定量变量?

在统计数据,序数而且名义上的变量都被考虑分类变量

尽管序数数据有时可以是数值的,但并不是所有的数学运算都可以对它们执行。

李克特量表是序数量表还是区间量表?

通常会考虑单独的李克特型问题顺序数据,因为这些项目有明确的等级顺序,但分布不均匀。

整体李克特量表分数有时被视为间隔数据。这些分数被认为是有方向性的,甚至它们之间的间隔。

数据的类型决定内容统计测试你应该用来分析你的数据。

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

班达里,P.(2022, 11月17日)。序数数据|定义,示例,数据收集与分析。Scribbr。检索于2022年12月14日,来自//www.charpingshvac.com/statistics/ordinal-data/

这篇文章有用吗?
Pritha班达里

普里塔拥有英语、心理学和认知神经科学方面的学术背景。作为一名跨学科研究人员,她喜欢为学生和学者撰写文章,解释棘手的研究概念。
Baidu