描述统计|定义,类型,示例

描述性统计总结和组织数据集的特征。数据集是来自样本或整个群体的反应或观察的集合。

定量研究,收集数据后,第一步统计分析是描述反应的特征,如一个变量的平均值(如年龄),或两个变量之间的关系(如年龄和创造力)。

下一步是推论统计,帮助你决定你的数据是否证实或反驳你的假设可概括的给更多的人。

描述性统计的类型

描述性统计主要有三种类型:

  • 分布关注每个值的频率。
  • 集中趋势关注值的平均值。
  • 可变性或者说分散性是指这些值是如何分散的。

在单变量分析中,您可以一次只评估一个变量;在双变量和多变量分析中,您可以应用这些变量来比较两个或多个变量。

研究的例子
你想按性别研究不同休闲活动的受欢迎程度。你分配一个调查并询问参与者在过去的一年里他们做了多少次以下每一件事:

  • 去图书馆
  • 在电影院看电影剧院
  • 参观国家公园

你的数据集是对调查的回应的集合。现在您可以使用描述性统计来找出每个活动的总体频率(分布)、每个活动的平均值(集中趋势)以及每个活动的响应范围(可变性)。

频率分布

数据集由值或分数的分布组成。在表格或图形中,您可以用数字或百分比总结变量的每个可能值的频率。这叫做频率分布

对于性别变量,在左边一栏列出所有可能的答案。您可以计算每个答案的响应数或百分比,并将其显示在右侧列上。

性别 数量
男性 182
235
其他 27

从这张表中,你可以看到参与研究的女性多于男性或其他性别认同的人。

在分组频率分布中,可以对数值响应值进行分组,并将每个组的响应数相加。您还可以将这些数字转换为百分比。

过去一年的图书馆访问量 百分比
0 - 4 6%
5 - 8 20%
9 - 12 42%
13 - 16 24%
17 + 8%

从这张表格中,你可以看到在过去的一年里,大多数人去图书馆的次数在5到16次之间。

接收关于语言、结构和格式的反馈

专业编辑校对和编辑您的论文,重点:

  • 学术风格
  • 模糊的句子
  • 语法
  • 风格的一致性

请看例子

集中趋势的度量

集中趋势的度量估计一个数据集的中心或平均值。均值,中位数和众数是求平均值的三种方法。

在这里,我们将演示如何使用我们调查的前6个回答来计算平均值,中位数和模式。

的意思是,或,是最常用的求平均值的方法。

要找到平均值,只需将所有响应值相加,然后除以响应总数。响应或观察的总数被称为N

平均访问图书馆次数
数据集 15 3 12 0 24 3
所有值的和 15 + 3 + 12 + 0 + 24 + 3 = 57
回复总数 N= 6
的意思是 值的和除以N找到: 57/6 =9.5

中位数是恰好位于数据集中间的值。

要找到中位数,请将每个响应值从最小到最大排序。然后,中位数是在中间的数字。如果中间有两个数,求它们的均值。

访问图书馆的中位数
有序数据集 0 3 3 12 15 24
中间的数字 3、12
中位数 求中间两个数的均值:(3 + 12)/2 =7.5

模式是最流行或最频繁的响应值。数据集可以没有模态、一个模态或多个模态。

要找到模态,请将数据集从低到高排序,并找到出现频率最高的响应。

模式图书馆访问次数
有序数据集 0 3 3 12 15 24
模式 找出最常见的回答:3.

可变性的测量

可变性的测量让你知道响应值是如何分布的。极差、标准差和方差分别反映了价差的不同方面。

范围

这个范围可以让你知道最极端的反应分数之间有多远。来找到范围,只需用最高值减去最低值。

过去一年去图书馆的次数
有序数据集:0 3 3 12 15 24

范围:24 - 0 =24

标准偏差

标准偏差年代SD)是数据集中可变性的平均值。它告诉你,平均而言,每个分数离平均值有多远。标准差越大,数据集的变量就越大。

寻找标准差有六个步骤:

  1. 列出每个分数并找出它们的平均值。
  2. 减去每个分数的平均值,得到与平均值的偏差。
  3. 对每个偏差进行平方。
  4. 把所有的方差平方加起来。
  5. 将方差的平方和除以N- 1。
  6. 求出你得到的数字的平方根。
过去一年去图书馆次数的标准差
在下表中,完成步骤1到4

原始数据 均值偏差 平方偏差
15 15 - 9.5 = 5.5 30.25
3. 3 - 9.5 = -6.5 42.25
12 12 - 9.5 = 2.5 6.25
0 0 -9.5 = -9.5 90.25
24 24 - 9.5 = 14.5 210.25
3. 3 - 9.5 = -6.5 42.25
= 9.5 Sum = 0 平方和= 421.5

步骤5:421.5/5 = 84.3

步骤6:√84.3 = 9.18

通过学习年代9.18,你可以说,平均而言,每个分数偏离平均值9.18分。

方差

方差是均值的方差的平均值。方差反映了数据集中的分布程度。数据越分散,相对于平均值的方差就越大。

要求方差,只需将标准差平方。方差的符号是年代2

过去一年去图书馆的次数变化
数据集:15 3 12 0 24 3

年代= 9.18

年代284.3

单变量描述性统计

单变量描述性统计一次只关注一个变量。使用分布、集中趋势和扩散的多种衡量方法分别检查每个变量的数据是很重要的。像SPSS和Excel这样的程序可以很容易地计算这些数据。

参观图书馆
N 6
的意思是 9.5
中位数 7.5
模式 3.
标准偏差 9.18
方差 84.3
范围 24

如果你只把平均值作为集中趋势的衡量标准,你对数据集“中间”的印象可能是倾斜通过异常值,不像中值或模式。

同样,当量程敏感时离群值,您还应该考虑标准偏差和方差,以获得易于比较的价差度量。

二元描述性统计

如果你收集的数据对于多个变量,可以使用双变量或多变量描述性统计来探索它们之间是否存在关系。

在双变量分析中,你同时研究两个变量的频率和变异性变量看看它们是否同时变化。在进一步执行之前,还可以比较两个变量的集中趋势统计测试

多变量分析与双变量分析相同,但有两个以上的变量。

列联表

在列联表中,每个单元格表示两个变量的交集。通常,一个独立变量(例如,性别)沿纵轴出现,而依赖项沿横轴出现(例如,活动)。你读了“对面”的表,看看如何独立和因变量相互联系。

过去一年图书馆的访问次数
集团 0 - 4 5 - 8 9 - 12 13 - 16 17 +
孩子们 32 68 37 23 22
成年人 36 48 43 83 25

当原始数据转换为百分比时,解释列联表会更容易。百分比使每一行与另一行具有可比性,使每组似乎只有100个观察结果或参与者。创建基于百分比的列联表时,可以添加N对于每个自变量。

过去一年到访图书馆次数(百分比)
集团 0 - 4 5 - 8 9 - 12 13 - 16 17 + N
孩子们 18% 37% 20% 13% 12% 182
成年人 15% 20% 18% 35% 11% 235

从这张表格可以更清楚地看出,儿童和成人每年去图书馆超过17次的比例相似。此外,儿童最常去图书馆的次数在5到8次之间,而成年人则在13到16次之间。

散点图

散点图是向你展示两个或三个之间关系的图表变量.这是一种关系强度的直观表现。

在散点图中,你沿着x轴绘制一个变量,沿着y轴绘制另一个变量。每个数据点由图表中的一个点表示。

散点图例子:去图书馆和去电影院
你调查了经常去图书馆的人是否更少去电影院看电影。你将参与者在电影院看电影的次数画在x轴上,去图书馆的次数画在y轴上。

从你的散点图中,你可以看到,随着在电影院观看的电影数量的增加,去图书馆的人数减少了。根据对可能的线性关系的可视化评估,执行进一步的相关性和回归测试。

描述性统计:散点图

关于描述性统计的常见问题

描述统计和推论统计的区别是什么?

描述性统计总结一个数据集的特征。推论统计允许你检验假设或者评估你的数据是否正确可概括的更广泛的人群。

描述性统计的三种主要类型是什么?

三种主要类型描述性统计关注数据集的频率分布、集中趋势和可变性。

单变量、双变量和多变量描述性统计有什么区别?
  • 单变量统计数字只作汇总一个变量一次。
  • 二元统计比较两个变量
  • 多元统计比较超过两个变量

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

班达里,P.(2022, 11月18日)。描述统计|定义,类型,示例。Scribbr。检索于2022年12月18日,来自//www.charpingshvac.com/statistics/descriptive-statistics/

这篇文章有用吗?
Pritha班达里

普里塔拥有英语、心理学和认知神经科学方面的学术背景。作为一名跨学科研究人员,她喜欢为学生和学者撰写文章,解释棘手的研究概念。
Baidu