描述统计|定义,类型,示例
描述性统计总结和组织数据集的特征。数据集是来自样本或整个群体的反应或观察的集合。
在定量研究,收集数据后,第一步统计分析是描述反应的特征,如一个变量的平均值(如年龄),或两个变量之间的关系(如年龄和创造力)。
下一步是推论统计,帮助你决定你的数据是否证实或反驳你的假设可概括的给更多的人。
描述性统计的类型
描述性统计主要有三种类型:
在单变量分析中,您可以一次只评估一个变量;在双变量和多变量分析中,您可以应用这些变量来比较两个或多个变量。
频率分布
数据集由值或分数的分布组成。在表格或图形中,您可以用数字或百分比总结变量的每个可能值的频率。这叫做频率分布.
性别 | 数量 |
---|---|
男性 | 182 |
女 | 235 |
其他 | 27 |
从这张表中,你可以看到参与研究的女性多于男性或其他性别认同的人。
过去一年的图书馆访问量 | 百分比 |
---|---|
0 - 4 | 6% |
5 - 8 | 20% |
9 - 12 | 42% |
13 - 16 | 24% |
17 + | 8% |
从这张表格中,你可以看到在过去的一年里,大多数人去图书馆的次数在5到16次之间。
集中趋势的度量
集中趋势的度量估计一个数据集的中心或平均值。均值,中位数和众数是求平均值的三种方法。
在这里,我们将演示如何使用我们调查的前6个回答来计算平均值,中位数和模式。
可变性的测量
可变性的测量让你知道响应值是如何分布的。极差、标准差和方差分别反映了价差的不同方面。
范围
这个范围可以让你知道最极端的反应分数之间有多远。来找到范围,只需用最高值减去最低值。
标准偏差
的标准偏差(年代或SD)是数据集中可变性的平均值。它告诉你,平均而言,每个分数离平均值有多远。标准差越大,数据集的变量就越大。
寻找标准差有六个步骤:
- 列出每个分数并找出它们的平均值。
- 减去每个分数的平均值,得到与平均值的偏差。
- 对每个偏差进行平方。
- 把所有的方差平方加起来。
- 将方差的平方和除以N- 1。
- 求出你得到的数字的平方根。
原始数据 | 均值偏差 | 平方偏差 |
---|---|---|
15 | 15 - 9.5 = 5.5 | 30.25 |
3. | 3 - 9.5 = -6.5 | 42.25 |
12 | 12 - 9.5 = 2.5 | 6.25 |
0 | 0 -9.5 = -9.5 | 90.25 |
24 | 24 - 9.5 = 14.5 | 210.25 |
3. | 3 - 9.5 = -6.5 | 42.25 |
米= 9.5 | Sum = 0 | 平方和= 421.5 |
步骤5:421.5/5 = 84.3
步骤6:√84.3 = 9.18
通过学习年代=9.18,你可以说,平均而言,每个分数偏离平均值9.18分。
方差
的方差是均值的方差的平均值。方差反映了数据集中的分布程度。数据越分散,相对于平均值的方差就越大。
要求方差,只需将标准差平方。方差的符号是年代2.
单变量描述性统计
单变量描述性统计一次只关注一个变量。使用分布、集中趋势和扩散的多种衡量方法分别检查每个变量的数据是很重要的。像SPSS和Excel这样的程序可以很容易地计算这些数据。
参观图书馆 | |
---|---|
N | 6 |
的意思是 | 9.5 |
中位数 | 7.5 |
模式 | 3. |
标准偏差 | 9.18 |
方差 | 84.3 |
范围 | 24 |
如果你只把平均值作为集中趋势的衡量标准,你对数据集“中间”的印象可能是倾斜通过异常值,不像中值或模式。
同样,当量程敏感时离群值,您还应该考虑标准偏差和方差,以获得易于比较的价差度量。
二元描述性统计
如果你收集的数据对于多个变量,可以使用双变量或多变量描述性统计来探索它们之间是否存在关系。
在双变量分析中,你同时研究两个变量的频率和变异性变量看看它们是否同时变化。在进一步执行之前,还可以比较两个变量的集中趋势统计测试.
多变量分析与双变量分析相同,但有两个以上的变量。
列联表
在列联表中,每个单元格表示两个变量的交集。通常,一个独立变量(例如,性别)沿纵轴出现,而依赖项沿横轴出现(例如,活动)。你读了“对面”的表,看看如何独立和因变量相互联系。
过去一年图书馆的访问次数 | |||||
---|---|---|---|---|---|
集团 | 0 - 4 | 5 - 8 | 9 - 12 | 13 - 16 | 17 + |
孩子们 | 32 | 68 | 37 | 23 | 22 |
成年人 | 36 | 48 | 43 | 83 | 25 |
当原始数据转换为百分比时,解释列联表会更容易。百分比使每一行与另一行具有可比性,使每组似乎只有100个观察结果或参与者。创建基于百分比的列联表时,可以添加N对于每个自变量。
过去一年到访图书馆次数(百分比) | ||||||
---|---|---|---|---|---|---|
集团 | 0 - 4 | 5 - 8 | 9 - 12 | 13 - 16 | 17 + | N |
孩子们 | 18% | 37% | 20% | 13% | 12% | 182 |
成年人 | 15% | 20% | 18% | 35% | 11% | 235 |
从这张表格可以更清楚地看出,儿童和成人每年去图书馆超过17次的比例相似。此外,儿童最常去图书馆的次数在5到8次之间,而成年人则在13到16次之间。
散点图
散点图是向你展示两个或三个之间关系的图表变量.这是一种关系强度的直观表现。
在散点图中,你沿着x轴绘制一个变量,沿着y轴绘制另一个变量。每个数据点由图表中的一个点表示。
关于描述性统计的常见问题
- 单变量、双变量和多变量描述性统计有什么区别?
-
- 单变量统计数字只作汇总一个变量一次。
- 二元统计比较两个变量.
- 多元统计比较超过两个变量.
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。