选择正确的统计检验|类型和例子

统计测试用于假设检验.它们可用于:

  • 确定预测变量与结果变量之间是否具有统计学上的显著关系。
  • 估计两个或多个组之间的差异。

统计检验假设零假设组与组之间没有关系或差别。然后,他们确定观察到的数据是否落在原假设预测的值范围之外。

如果你已经知道了变量类型您正在处理的问题,您可以使用流程图为您的数据选择正确的统计测试。

统计测试流程图

统计检验是做什么的?

统计检验通过计算检验统计量-一个数字,描述你的测试中变量之间的关系与没有关系的零假设有多大不同。

然后计算p价值(概率值)。的p-value估计如果零假设为真,您将看到检验统计量所描述的差异的可能性有多大。

如果检验统计量的值比从零假设计算的统计量更极端,则可以推断出一个统计上显著的关系在预测变量和结果变量之间。

如果检验统计量的值比从零假设计算出的值更极端,那么您可以推断没有统计学意义上的关系在预测变量和结果变量之间。

何时进行统计检验

可以对以统计有效的方式收集的数据执行统计测试—可以通过实验,或通过观察作出使用概率抽样方法

对于一个统计测试来说有效的,你的样本量需要足够大,以接近被研究总体的真实分布。

要确定使用哪种统计检验,您需要知道:

  • 你的数据是否符合某些假设。
  • 变量类型你正在处理的问题。

统计假设

统计测试对他们测试的数据做了一些常见的假设:

  1. 观察的独立性(也就是不自相关):您在测试中包含的观察值/变量是不相关的(例如,单个测试对象的多个测量值不是独立的,而多个不同测试对象的测量值是独立的)。
  2. 方差齐性:方差在每个被比较的组中,所有组之间是相似的。如果一个组的变异比其他组多得多,就会限制测试的有效性。
  3. 数据的常态性:数据遵循a正态分布(又称钟形曲线)。这个假设只适用于定量数据

如果您的数据不符合正态性或方差齐性的假设,您可以执行a非参数统计检验,这样就可以在不对数据分布做任何假设的情况下进行比较。

如果您的数据不符合观察结果独立性的假设,则可以使用解释数据结构的测试(重复测量测试或包含阻塞变量的测试)。

变量类型

变量类型你通常已经决定了你可以使用什么类型的统计检验。

定量变量表示事物的数量(例如森林中树木的数量)。定量变量的类型包括:

  • 连续(又名变量):表示度量,通常可以分为小于1的单位(例如0.75克)。
  • 离散(又名整数变量):表示计数,通常不能被分成小于1的单位(例如1棵树)。

分类变量表示事物的分组(例如森林中的不同树种)。分类变量的类型包括:

  • 序数:用顺序表示数据(如排名)。
  • 名义上的:代表群体名称(例如品牌或物种名称)。
  • 二进制:表示结果为yes/no或1/0的数据(例如,输赢)。

选择适合您所收集的预测器和结果变量类型的测试(如果您正在进行测试)实验,这些是自变量和因变量).参考下面的表格,看看哪个测试最匹配您的变量。

以下是学生们喜欢Scribbr校对服务的原因

发现校对和编辑

选择参数检验:回归、比较或相关

参数检验通常比非参数检验有更严格的要求,并且能够从数据中做出更强的推断。它们只能使用符合统计检验的共同假设的数据进行。

最常见的参数检验类型包括回归检验、比较检验和相关检验。

回归测试

回归测试寻找因果关系.它们可以用来估计一个或多个连续变量对另一个变量的影响。

预测变量 结果变量 研究问题示例
简单线性回归
  • 连续
  • 1预测
  • 连续
  • 1的结果
的效果是什么收入长寿?
多元线性回归
  • 连续
  • 2个或更多的预测因子
  • 连续
  • 1的结果
的效果是什么收入而且每天锻炼几分钟长寿?
逻辑回归
  • 连续
  • 二进制
的效果是什么药物剂量测试对象的存活?

比较测试

比较测试查找组均值差异.它们可以用来测试分类变量对结果的影响平均值还有其他一些特点。

t用于精确地比较两组的平均值(例如,男性和女性的平均身高)。方差分析和MANOVA检验用于比较意味着超过两组(例如,儿童、青少年和成人的平均身高)。

预测变量 结果变量 研究问题示例
配对t检验
  • 分类
  • 1预测
  • 定量
  • 群体来自同一种群
的效果是什么两种不同的备考计划平均考试成绩同一个班级的学生?
独立的学习
  • 分类
  • 1预测
  • 定量
  • 群体来自不同的人群
区别在哪里平均考试成绩来自两种不同的流派?
方差分析
  • 分类
  • 1个或多个预测器
  • 定量
  • 1的结果
区别在哪里平均疼痛程度在术后患者中三种不同的止痛药?
MANOVA
  • 分类
  • 1个或多个预测器
  • 定量
  • 2个或更多结果
的效果是什么花的种类花瓣长度花瓣宽,阀杆的长度?

相关测试

相关测试检查变量之间是否存在关联没有假设因果关系。

这些可以用来测试你想在(例如)多元回归测试中使用的两个变量是否自相关。

变量 研究问题示例
皮尔森的r
  • 2个连续变量
是如何纬度而且温度有关吗?

选择非参数检验

非参数检验不会对数据做出太多假设,当一个或多个常见统计假设被违背时,是非参数检验非常有用。然而,他们得出的推论并不像参数检验那样有力。

预测变量 结果变量 用来代替……
斯皮尔曼的r
  • 定量
  • 定量
皮尔森的r
卡方独立性检验
  • 分类
  • 分类
皮尔森的r
信号测试
  • 分类
  • 定量
一个示例t以及
克鲁斯卡尔-沃利斯H
  • 分类
  • 3组或以上
  • 定量
方差分析
ANOSIM
  • 分类
  • 3组或以上
  • 定量
  • 2个或更多结果变量
MANOVA
Wilcoxon秩和检验
  • 分类
  • 两组
  • 定量
  • 群体来自不同的人群
独立的学习
Wilcoxon符号秩检验
  • 分类
  • 两组
  • 定量
  • 群体来自同一种群
配对t检验

流程图:选择统计检验

此流程图帮助您在参数测试中进行选择。对于非参数选项,请检查上表。

选择正确的统计检验

关于统计检验的常见问题

统计检验的主要假设是什么?

统计测试通常假设:

  1. 数据是正态分布的
  2. 被比较的两组有相似之处方差
  3. 数据是独立的

如果您的数据不符合这些假设,您可能仍然可以使用非参数统计检验,它们的要求更少,但推论也更弱。

什么是检验统计量?

一个检验统计量一个数字是由a计算出来的吗统计检验.它描述了你观测到的数据距离零假设没有关系变量或者说样本组之间没有差异。

检验统计量告诉您两个或多个组与总体有多大不同的意思是,或线性斜率与由a预测的斜率有多大不同零假设.在不同的统计检验中使用不同的检验统计量。

什么是统计显著性?

统计显著性研究人员使用的一个术语是表示他们的观察不太可能发生在零假设统计检验.意义通常用a表示p价值,或概率值。

统计显著性是任意的——它取决于研究人员选择的阈值或alpha值。最常见的阈值是p< 0.05,这意味着该数据可能出现在低于5%的情况下零假设

p-value低于所选的alpha值,那么我们说测试的结果具有统计显著性。

定量变量和分类变量的区别是什么?

定量变量是否有数据表示数量的变量(例如身高、体重或年龄)。

分类变量是否有数据表示组的变量。这包括排名(例如在比赛中获得的名次)、分类(例如谷物的品牌)和二元结果(例如抛硬币)。

你需要知道是什么变量类型您正在为您的数据选择正确的统计测试,并解释您的数据结果

离散变量和连续变量的区别是什么?

离散连续变量有两种类型定量变量

  • 离散变量表示计数(例如集合中对象的数量)。
  • 连续变量表示可测量的量(例如水量或重量)。

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

Bevans, R.(2022年12月05日)。选择正确的统计检验|类型和例子。Scribbr。检索于2022年12月18日,来自//www.charpingshvac.com/statistics/statistical-tests/

这篇文章有用吗?
丽贝卡·贝

丽贝卡正在攻读土壤生态学博士学位,空闲时间用来写作。她很高兴能和大家一起研究统计数据。
Baidu