独立性卡方检验|公式,指南和例子

一个卡方检验(Χ2)独立性测验是一个<一个href="//www.charpingshvac.com/statistics/statistical-tests/" data-wpel-link="internal">非参数<一个href="//www.charpingshvac.com/statistics/hypothesis-testing/" data-wpel-link="internal">假设检验.你可以用它来测试是否有两个<一个href="//www.charpingshvac.com/methodology/types-of-variables/" data-wpel-link="internal">分类变量都是相互关联的。

例子:卡方独立性检验
假设一个城市想要鼓励更多的居民回收他们的家庭垃圾。

该市决定测试两种干预措施:一种是教育<一个href="//www.charpingshvac.com/commonly-confused-words/flier-vs-flyer/" data-wpel-link="internal">摩天观景轮(小册子)或一个电话。他们随机选择了300户家庭<一个href="//www.charpingshvac.com/methodology/random-assignment/" data-wpel-link="internal">随机分配发给传单,打电话,或者<一个href="//www.charpingshvac.com/methodology/control-group/" data-wpel-link="internal">对照组(无干预)。他们将根据实验结果来决定对整个城市采取何种干预措施。

该市计划使用卡方独立检验来测试在不同干预措施中回收垃圾的家庭比例是否不同。

独立性的卡方检验是什么?

卡方(Χ2独立测验是皮尔逊测验的一种<一个href="//www.charpingshvac.com/statistics/chi-square-tests/" data-wpel-link="internal">卡方检验.皮尔逊卡方检验是分类变量的非参数检验。它们被用来确定你的数据是否<一个href="//www.charpingshvac.com/statistics/statistical-significance/" data-wpel-link="internal">显著和你想象的不一样。

你可以使用独立卡方检验,也称为关联卡方检验,来确定两个分类变量是否相关。如果两个<一个href="//www.charpingshvac.com/methodology/types-of-variables/" data-wpel-link="internal">变量是相关的,一个变量具有某个值的概率取决于另一个变量的值。

注意:您可以说您正在测试变量是否相关、关联、偶然或依赖—这些都是同义词。

独立性卡方检验计算基于观测频率,即每个组合组中的观测数量。

该测试将观察到的频率与您在两个变量不相关时所期望的频率进行比较。当变量不相关时,观察到的频率和期望的频率将是相似的。

应急表

当您想要执行独立性的卡方检验时,组织数据的最佳方法是频率分布表被称为列联表

列联表,也称为交叉表或交叉表,显示每组组合中的观察数。它通常还包括行和列的总和。

示例:列联表
干预6个月后,市政府查看了300户家庭的结果(这里只显示了4户家庭):

家庭地址 干预 结果 榆树街25号 摩天观景轮 回收 雪松街100号 控制 回收 枫叶街3号 控制 不回收 橡树街123号 电话 回收 ... ... ...

他们将数据重新组织到一个列联表中:

干预 回收 不回收 行总数 传单(小册子) 89 9 98 电话 84 8 92 控制 86 24 110 列的总数 259 41 N= 300

他们还将数据可视化为柱状图:

<一个cl一个ss="colorbox" href="https://cdn.scribbr.com/wp-content/uploads/2022/05/Contingency-table-bar-graph.webp" data-wpel-link="internal">Contingency-table-bar-graph

独立假设卡方检验

独立性卡方检验是一个<一个href="//www.charpingshvac.com/statistics/inferential-statistics/" data-wpel-link="internal">推论统计检验,这意味着它可以让你得出关于<一个href="//www.charpingshvac.com/methodology/population-vs-sample/" data-wpel-link="internal">人口基于样本.具体来说,它可以让你得出总体中两个变量是否相关的结论。

像所有的假设检验一样,独立性卡方检验评估一个零假设和备用假设。这两个假设是对“变量1和变量2相关吗?”这个问题的两个相互矛盾的答案。

你可以用上面的句子作为模板。用变量名替换变量1和变量2。

例子:零假设和替代假设
人口是城市里所有的家庭。

  • 零假设(H0):家庭是否回收废物,以及他们所接受的干预类型没有关系在人口中;回收利用的家庭比例是相同的所有的干预。
  • 备择假设(H一个):家庭是否回收废物,以及他们所接受的干预类型相关的在人口中;回收利用的家庭比例是不一样所有的干预。

预期值

卡方独立性检验通过比较观测频率和预期频率来工作。期望频率是这样的,即一个变量的比例对于另一个变量的所有值是相同的。

您可以使用列联表计算期望频率。行的期望频率r和列c是:

\开始{方程*}\ dfrac {(\ textup{行}\,\ r \ \ \ textup{总}\,,\ \ * \ textup{列}\ \,c \ \ \ textup{总})}{N} \{方程*}结束

示例:期望值
城市使用列联表计算预期频率。

观察到的和预期的频率(上面观察到的,下面预期的) 干预 回收 不回收 行总数 传单(小册子) 89 9 98 \ dfrac {(98 \ times259)} {300} = 84.61 \ dfrac {(98 \ times41)} {300} = 13.39 电话 84 8 92 \ dfrac {(92 \ times259)} {300} = 79.43 \ dfrac {(92 \ times41)} {300} = 12.57 控制 86 24 110 \ dfrac {(110 \ times259)} {300} = 94.97 \ dfrac {(110 \ times41)} {300} = 15.03 列的总数 259 41 N = 300

预期频率是这样的,回收所有干预措施的家庭比例是相同的:<一个cl一个ss="colorbox" href="https://cdn.scribbr.com/wp-content/uploads/2022/05/Expected-values-bar-graph.webp" data-wpel-link="internal">Expected-values-bar-graph

校对对你的论文有什么好处?

Scribbr编辑不仅纠正语法和拼写错误,还通过确保你的论文没有模糊的语言、多余的单词和尴尬的措辞来加强你的写作。

参见编辑示例

何时使用独立性卡方检验

如果你想进行卡方拟合优度测试,以下条件是必要的:

  1. 你想验证一个假设关于两个分类变量(二进制、标称或序数)。
    • 独立性卡方检验通常在二进制或二进制上进行<一个href="//www.charpingshvac.com/statistics/nominal-data/" data-wpel-link="internal">名义上的变量。它们有时会被表演<一个href="//www.charpingshvac.com/statistics/ordinal-data/" data-wpel-link="internal">序数变量,虽然一般只对少于五组的序数变量。
  2. 样本随机ly选择从<一个href="//www.charpingshvac.com/methodology/population-vs-sample/" data-wpel-link="internal">人口
  3. 有一个预计至少有五次观察在每个组合组中。
例子:独立条件的卡方检验
该市可以使用卡方拟合优度检验来分析回收干预数据,因为所有三个条件都已满足:

  1. 他们想要测试一个关于两个分类变量之间关系的假设:家庭是否回收和干预的类型。
  2. 他们随机抽取了300户家庭作为样本。
  3. 每个合并组预期至少有5个观察值。最小的期望频率是12.57。

如何计算检验统计量(公式)

皮尔逊卡方(Χ)2)是<一个href="//www.charpingshvac.com/statistics/test-statistic/" data-wpel-link="internal">检验统计量对于独立性的卡方检验:

\{方程*}开始X ^ 2 = \总和{\压裂{(执着)^ 2}{E}}{方程*}\结束美元

在哪里

  • Χ2卡方检验是统计量吗
  • Σ是求和运算符(它的意思是“取求和”)
  • O为观测频率
  • E是期望频率

卡方检验的<一个href="//www.charpingshvac.com/statistics/test-statistic/" data-wpel-link="internal">检验统计量测量你观察到的频率与你期望的频率之间的差异,如果这两个变量是不相关的。当观测频率和预期频率之间有很大差异时,它就很大(OE在方程中)。

按照以下五个步骤来计算测试统计量:

步骤1:创建表

在两列中创建一个表,其中包含观察到的和预期的频率。

示例:步骤1
干预 结果 观察到的 预期
摩天观景轮 回收 89 84.61
不回收 9 13.39
电话 回收 84 79.43
不回收 8 12.57
控制 回收 86 94.97
不回收 24 15.03

2 .计算O−e

在一个叫做"O−E,用观测到的频率减去期望的频率。

示例:步骤2
干预 结果 观察到的 预期 O−e
摩天观景轮 回收 89 84.61 4.39
不回收 9 13.39 -4.39
电话 回收 84 79.43 4.57
不回收 8 12.57 -4.57
控制 回收 86 94.97 -8.97
不回收 24 15.03 8.97

第三步:计算(O - e2

在一个叫做" (O−E2,将前一列的值平方。

示例:步骤3
干预 结果 观察到的 预期 O−e O−e2
摩天观景轮 回收 89 84.61 4.39 19.27
不回收 9 13.39 -4.39 19.27
电话 回收 84 79.43 4.57 20.88
不回收 8 12.57 -4.57 20.88
控制 回收 86 94.97 -8.97 80.46
不回收 24 15.03 8.97 80.46

第四步:计算(O−e2/ E

在最后一列“(O−E)”2/ E”,将前一列除以期望频率。

示例:步骤4
干预 结果 观察到的 预期 O−e O−e2 O−e2/E
摩天观景轮 回收 89 84.61 4.39 19.27 0.23
不回收 9 13.39 -4.39 19.27 1.44
电话 回收 84 79.43 4.57 20.88 0.26
不回收 8 12.57 -4.57 20.88 1.66
控制 回收 86 94.97 -8.97 80.46 0.85
不回收 24 15.03 8.97 80.46 5.35

步骤5:计算Χ2

最后,将前一列的值相加,计算卡方检验统计量(Χ2)。

示例:步骤5
Χ2= 0.23 + 1.44 + 0.26 + 1.66 + 0.85 + 5.35

Χ2= 9.79

如何进行独立性卡方检验

如果检验统计量足够大,那么你应该得出结论,如果变量不相关,观察到的频率不是你所期望的。但怎样才算够大呢?

我们将检验统计量与a中的临界值进行比较<一个href="//www.charpingshvac.com/statistics/chi-square-distributions/" data-wpel-link="internal">卡方分布来决定它是否大到可以拒绝<一个href="//www.charpingshvac.com/statistics/null-and-alternative-hypotheses/" data-wpel-link="internal">零假设这两个变量是无关的。这个过程被称为独立性卡方检验。

按照以下步骤执行独立性卡方检验(回收示例已经完成了前两步):

第一步:计算预期频率

用列联表计算<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">期望频率公式如下:

\开始{方程*}\ dfrac {(\ textup{行}\,\ r \ \ \ textup{总}\,,\ \ * \ textup{列}\ \,c \ \ \ textup{总})}{\ textup{大}\,\ \ textup总}{}\{方程*}结束

第二步:计算卡方

使用皮尔逊卡方公式<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">计算检验统计量

\{方程*}开始X ^ 2 = \总和{\压裂{(O - E) ^ 2} {E}}{方程*}\结束

步骤3:找到临界卡方值

你可以在a中找到临界值<一个href="//www.charpingshvac.com/statistics/chi-square-distribution-table/" data-wpel-link="internal">卡方临界值表或者使用统计软件。你需要知道两个数字来找到临界值:

  • 的<一个href="//www.charpingshvac.com/statistics/degrees-of-freedom/" data-wpel-link="internal">自由度df):对于独立性的卡方检验,df是(变量1组的个数−1)*(变量2组的个数−1)。
  • 显著性水平(α):按照惯例,显著性水平通常是0.05。
示例:寻找临界卡方值
由于有三个干预组(传单、电话和对照组)和两个结果组(回收和不回收),因此有(3−1)*(2−1)= 2个自由度。

对于α = .05和的显著性检验df= 2,则Χ2临界值为5.99。

步骤4:将卡方值与临界值进行比较

检验统计量大到足以拒绝零假设吗?将其与临界值进行比较,找出答案。

示例:卡方值与临界值的比较
Χ2= 9.79

临界值= 5.99

的Χ2值大于临界值。

第五步:决定是否拒绝原假设

  • 如果Χ2值是更大的小于临界值,则观测分布与期望分布之间的差异具有统计学意义(<一个href="//www.charpingshvac.com/statistics/p-value/" data-wpel-link="internal">p<α).
    • 数据允许你这样做<一个href="//www.charpingshvac.com/statistics/hypothesis-testing/" data-wpel-link="internal">拒绝原假设变量是不相关的,并为<一个href="//www.charpingshvac.com/statistics/null-and-alternative-hypotheses/" data-wpel-link="internal">备择假设变量是相关的。
  • 如果Χ2值是小于临界值时,则观测分布与期望分布之间的差异无统计学意义(p>α).
    • 这些数据不允许你拒绝零假设,即变量是不相关的,也不支持备用假设,即变量是相关的。
示例:决定是否拒绝零假设
的Χ2值大于临界值。因此,城市拒绝零假设是一个家庭是否回收和他们接受的干预类型不相关的

有一个显著性差异如果两个变量不相关,则在观测频率和预期频率之间(p< . 05)。这表明回收的家庭比例是不一样所有的干预。

该市得出结论,他们的干预措施对家庭是否选择回收有影响。

第六步:进行事后测试(可选)

如果任何一个变量中有超过两组,而你拒绝了零假设,你可能想要用事后检验进一步调查。事后测试是在初始分析之后执行的后续测试。

类似于<一个href="//www.charpingshvac.com/statistics/one-way-anova/" data-wpel-link="internal">单向方差分析对于两个以上的组,显著差异并不能告诉你哪些组的比例显著不同。

一种事后的方法是使用卡方独立性检验和邦费罗尼校正对每对组进行比较。Bonferroni修正是指你把原图分开<一个href="//www.charpingshvac.com/statistics/statistical-significance/" data-wpel-link="internal">显著性水平(通常是.05)通过您正在执行的测试数量。

示例:事后测试
虽然城市现在知道,对于所有干预措施,家庭回收的比例并不相同,但他们不知道哪些干预措施彼此不同。为了找到答案,他们进行了事后测试,用卡方独立性检验比较每对干预措施。

独立性卡方检验 卡方检验统计量 传单vs.电话 0.014 飞行者vs.控制者 6.198 电话vs.控制 6.471
  • 由于每个试验有两个干预组和两个结果组,因此有(2−1)*(2−1)= 1个自由度。
  • 有三个检验,因此应用Bonferroni校正的显著性水平为α = .05 / 3 = .016。
  • 对于α = .016和df= 1,则Χ2临界值为5.803。
  • 卡方值大于小册子测试与对照测试、电话测试与对照测试的临界值。

根据这些发现,该市得出结论,与对照组相比,收到小册子或电话后回收的家庭比例明显更高。

宣传册和电话干预在比例上没有显著差异,所以城市选择电话干预是因为它产生的纸张浪费更少。

何时使用不同的测试

有几个测试类似于独立性卡方检验,所以使用哪个并不总是很明显。最佳选择取决于你的变量、样本大小和假设。

何时使用卡方拟合优度检验

皮尔逊卡方检验有两种类型。独立性卡方检验就是其中之一,还有<一个href="//www.charpingshvac.com/statistics/chi-square-goodness-of-fit/" data-wpel-link="internal">卡方拟合优度检验是另一个。这两个测试的数学方法是相同的——主要的区别是如何计算期望值。

你应该用卡方拟合优度检验一个分类变量,你想测试一个<一个href="//www.charpingshvac.com/methodology/hypothesis/" data-wpel-link="internal">假设对其分布

什么时候用费雪精确检验法

如果样本量较小(N< 100),费雪精确检验是更好的选择。当你的数据不满足时,你应该特别选择费雪精确检验<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">条件在每个组合组中预期至少有5个观察值。

何时使用McNemar测试

你应该使用<一个href="//www.charpingshvac.com/statistics/chi-square-tests/" data-wpel-link="internal">McNemar检验法检验当你有一个关系密切一对分类变量,每个变量有两组。它允许你测试变量的比例是否相等。这种测试最常用于比较同一个体观察前后的情况。

何时使用G测验

一个G检验和卡方检验给出了大致相同的结果。G测试可以适应更复杂的情况<一个href="//www.charpingshvac.com/methodology/experimental-design/" data-wpel-link="internal">实验设计而不是卡方检验。然而,这些测试通常是可互换的,选择主要是个人喜好的问题。

偏爱卡方检验的一个原因是,大多数领域的研究人员都更熟悉卡方检验。

实践问题

你想测试一下卡方拟合优度检验的知识吗?用下面的按钮下载我们的练习题和例子。

下载Word文档<一个cl一个ss="btn btn--blue ext-link" href="https://docs.google.com/document/d/13mVUYHkuu-SAvrrc_9du7AhOCmofiZDdy4A7nyN_7zU/copy" data-wpel-link="external" target="_blank" rel="nofollow external noopener">下载谷歌doc

关于独立性卡方检验的常见问题

如何在Excel中进行独立性卡方检验?

您可以使用CHISQ.TEST ()函数执行<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">独立性卡方检验在Excel中。它需要两个参数,CHISQ。TEST(observed_range, expected_range),并返回p价值。

如何在R中进行卡方独立性检验?

您可以使用chisq.test ()函数执行<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">独立性卡方检验给出列联表作为x参数的矩阵。例如:

M =矩阵(数据= c(89, 84, 86, 9, 8, 24), nrow = 3, ncol = 2)

chisq。测验(x = m)

卡方检验有哪两种主要类型?

两个主要的<一个href="//www.charpingshvac.com/statistics/chi-square-distributions/" data-wpel-link="internal">卡方测试是<一个href="//www.charpingshvac.com/statistics/chi-square-goodness-of-fit/" data-wpel-link="internal">卡方拟合优度检验和<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">独立性卡方检验

卡方分布有什么性质?

一个<一个href="//www.charpingshvac.com/statistics/chi-square-distributions/" data-wpel-link="internal">卡方分布是一个<一个href="//www.charpingshvac.com/statistics/probability-distributions/" data-wpel-link="internal">连续概率分布.卡方分布的形状取决于它<一个href="//www.charpingshvac.com/statistics/degrees-of-freedom/" data-wpel-link="internal">自由度k.卡方分布的均值等于其自由度(k)及<一个href="//www.charpingshvac.com/statistics/variance/" data-wpel-link="internal">方差是2k.范围是0到∞。

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

特尼,S.(2022年11月10日)。独立性卡方检验|公式,指南和例子。Scribbr。检索于2022年12月14日,来自//www.charpingshvac.com/statistics/chi-square-test-of-independence/

这篇文章有用吗?
Baidu