标称数据|定义,示例,数据收集和分析
名义上的数据在变量中被标记为互斥的类别。这些类别不能以有意义的方式进行排序。
例如,pref错误的交通方式是一个名义变量,因为数据被分类为:汽车、公共汽车、火车、有轨电车、自行车等。
测量水平
的测量水平指示记录数据的精确程度。有四个层次:名义上的,序数,时间间隔,比.级别越高,测量就越复杂。
名义数据是最不精确和最复杂的。名义上的意思是“名义上的”,所以这类数据只能是贴上标签.它没有等级顺序,值之间的间距相等,也没有真正的零值。
标称数据示例
在名义水平上,每个反应或观察只能归入一个类别。
标称数据可以用文字或数字表示。但是,即使数据有数字标签,也不能对数据进行排序标签以一种有意义的方式或用它们进行算术运算。
在社会科学研究中,名义变量通常包括性别、种族、政治偏好或学号。
变量 | 类别 |
---|---|
邮政编码 |
|
政治倾向 |
|
就业状况 |
|
文学流派 |
|
变量类型只能以两种方式编码的(例如,是/否或受雇/失业)被称为二进制或二分。因为这些变量中标签的顺序无关紧要,所以它们是名义变量的类型。
如何收集名义数据
名义数据可以通过开放式或封闭式方式收集调查的问题。
如果您感兴趣的变量只有几个可能的标签来捕获所有数据,则使用封闭式问题。
你的性别是什么? | 男性 女 其他 宁愿不回答 |
---|---|
你有智能手机吗? | 是的 没有 |
你最喜欢的电影类型是什么? | 浪漫 行动 神秘 动画 音乐的 喜剧 惊悚片 |
如果你感兴趣的变量有很多可能的标签,或者你无法生成一个完整的标签列表,那么就使用开放式问题。
如何分析名义数据
要分析标称数据,可以在表格和图表中组织和可视化数据。
然后,你可以收集一些描述性统计关于你的数据集。这些可以帮助您评估频率分布并找到数据的集中趋势。但并非全部集中趋势的度量或可变性适用于标称数据。
共和党人 民主党人 独立的 独立的 共和党人 共和党人 共和党人 民主党人 独立的 |
独立的 共和党人 民主党人 民主党人 民主党人 民主党人 共和党人 民主党人 民主党人 |
民主党人 共和党人 民主党人 民主党人 独立的 共和党人 共和党人 民主党人 民主党人 |
分布
要组织此数据集,您可以创建一个频率分布表,以显示每种政治偏好类别的响应数量。
政治倾向 | 频率 |
---|---|
民主党人 | 13 |
共和党人 | 9 |
独立的 | 5 |
政治倾向 | 百分比 |
---|---|
民主党人 | 48.1% |
共和党人 | 33.3% |
独立的 | 18.5% |
使用这些表,您还可以以图形和图表的形式可视化数据集的分布。
集中趋势
的集中趋势你的数据集告诉你你的大部分价值在哪里。
众数、平均数和中位数是三种最常用的集中趋势度量。但是,只有模式可以用于标称数据。
为了得到中位数对于一个数据集,您必须能够将值从低到高进行排序。为的意思是,您需要能够对数据集中的值执行加法和除法等算术操作。虽然名义数据可以按类别分组,但不能对其进行排序或求和。
因此,名义数据的集中趋势只能用模式-最常出现的值。
名义数据的统计检验
推论统计帮助您测试科学假设关于你的数据。非参数统计检验用于标称数据。
而参数测试假设数据集的某些特征,比如正态分布在分数中,这些不适用于名义数据,因为数据不能以任何有意义的方式排序。
卡方测试在非参数统计测试对于分类变量。拟合优度卡方检验可用于只有一个变量的数据集,而独立性卡方检验可用于有两个变量的数据集。
的卡方拟合优度检验当您从单个节点收集数据时使用人口通过随机抽样。为了衡量你的样本的代表性,你可以使用这个测试来评估是否频率分布你的样本与你对更广泛人群的期望相符。
与独立性卡方检验,你可以找出两个范畴变量之间的关系统计上显著.
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。