独立性卡方检验|公式,指南和例子
一个卡方检验(Χ2)独立性测验是一个<一个href="//www.charpingshvac.com/statistics/statistical-tests/" data-wpel-link="internal">非参数一个><一个href="//www.charpingshvac.com/statistics/hypothesis-testing/" data-wpel-link="internal">假设检验一个>.你可以用它来测试是否有两个<一个href="//www.charpingshvac.com/methodology/types-of-variables/" data-wpel-link="internal">分类变量一个>都是相互关联的。
独立性的卡方检验是什么?
卡方(Χ2独立测验是皮尔逊测验的一种<一个href="//www.charpingshvac.com/statistics/chi-square-tests/" data-wpel-link="internal">卡方检验一个>.皮尔逊卡方检验是分类变量的非参数检验。它们被用来确定你的数据是否<一个href="//www.charpingshvac.com/statistics/statistical-significance/" data-wpel-link="internal">显著一个>和你想象的不一样。
你可以使用独立卡方检验,也称为关联卡方检验,来确定两个分类变量是否相关。如果两个<一个href="//www.charpingshvac.com/methodology/types-of-variables/" data-wpel-link="internal">变量一个>是相关的,一个变量具有某个值的概率取决于另一个变量的值。
独立性卡方检验计算基于观测频率,即每个组合组中的观测数量。
该测试将观察到的频率与您在两个变量不相关时所期望的频率进行比较。当变量不相关时,观察到的频率和期望的频率将是相似的。
应急表
当您想要执行独立性的卡方检验时,组织数据的最佳方法是频率分布表被称为列联表.
列联表,也称为交叉表或交叉表,显示每组组合中的观察数。它通常还包括行和列的总和。
独立假设卡方检验
独立性卡方检验是一个<一个href="//www.charpingshvac.com/statistics/inferential-statistics/" data-wpel-link="internal">推论一个>统计检验,这意味着它可以让你得出关于<一个href="//www.charpingshvac.com/methodology/population-vs-sample/" data-wpel-link="internal">人口基于样本.具体来说,它可以让你得出总体中两个变量是否相关的结论。
像所有的假设检验一样,独立性卡方检验评估一个零假设和备用假设。这两个假设是对“变量1和变量2相关吗?”这个问题的两个相互矛盾的答案。
你可以用上面的句子作为模板。用变量名替换变量1和变量2。
预期值
卡方独立性检验通过比较观测频率和预期频率来工作。期望频率是这样的,即一个变量的比例对于另一个变量的所有值是相同的。
您可以使用列联表计算期望频率。行的期望频率r和列c是:
何时使用独立性卡方检验
如果你想进行卡方拟合优度测试,以下条件是必要的:
- 你想验证一个假设关于两个分类变量(二进制、标称或序数)。
- 独立性卡方检验通常在二进制或二进制上进行<一个href="//www.charpingshvac.com/statistics/nominal-data/" data-wpel-link="internal">名义上的一个>变量。它们有时会被表演<一个href="//www.charpingshvac.com/statistics/ordinal-data/" data-wpel-link="internal">序数一个>变量,虽然一般只对少于五组的序数变量。
- 的样本随机ly选择从<一个href="//www.charpingshvac.com/methodology/population-vs-sample/" data-wpel-link="internal">人口一个>.
- 有一个预计至少有五次观察在每个组合组中。
如何计算检验统计量(公式)
皮尔逊卡方(Χ)2)是<一个href="//www.charpingshvac.com/statistics/test-statistic/" data-wpel-link="internal">检验统计量一个>对于独立性的卡方检验:
在哪里
- Χ2卡方检验是统计量吗
- Σ是求和运算符(它的意思是“取求和”)
- O为观测频率
- E是期望频率
卡方检验的<一个href="//www.charpingshvac.com/statistics/test-statistic/" data-wpel-link="internal">检验统计量一个>测量你观察到的频率与你期望的频率之间的差异,如果这两个变量是不相关的。当观测频率和预期频率之间有很大差异时,它就很大(O−E在方程中)。
按照以下五个步骤来计算测试统计量:
步骤1:创建表
在两列中创建一个表,其中包含观察到的和预期的频率。
干预 | 结果 | 观察到的 | 预期 |
---|---|---|---|
摩天观景轮 | 回收 | 89 | 84.61 |
不回收 | 9 | 13.39 | |
电话 | 回收 | 84 | 79.43 |
不回收 | 8 | 12.57 | |
控制 | 回收 | 86 | 94.97 |
不回收 | 24 | 15.03 |
2 .计算O−e
在一个叫做"O−E,用观测到的频率减去期望的频率。
干预 | 结果 | 观察到的 | 预期 | O−e |
---|---|---|---|---|
摩天观景轮 | 回收 | 89 | 84.61 | 4.39 |
不回收 | 9 | 13.39 | -4.39 | |
电话 | 回收 | 84 | 79.43 | 4.57 |
不回收 | 8 | 12.57 | -4.57 | |
控制 | 回收 | 86 | 94.97 | -8.97 |
不回收 | 24 | 15.03 | 8.97 |
第三步:计算(O - e)2
在一个叫做" (O−E)2,将前一列的值平方。
干预 | 结果 | 观察到的 | 预期 | O−e | (O−e)2 |
---|---|---|---|---|---|
摩天观景轮 | 回收 | 89 | 84.61 | 4.39 | 19.27 |
不回收 | 9 | 13.39 | -4.39 | 19.27 | |
电话 | 回收 | 84 | 79.43 | 4.57 | 20.88 |
不回收 | 8 | 12.57 | -4.57 | 20.88 | |
控制 | 回收 | 86 | 94.97 | -8.97 | 80.46 |
不回收 | 24 | 15.03 | 8.97 | 80.46 |
第四步:计算(O−e)2/ E
在最后一列“(O−E)”2/ E”,将前一列除以期望频率。
干预 | 结果 | 观察到的 | 预期 | O−e | (O−e)2 | (O−e)2/E |
---|---|---|---|---|---|---|
摩天观景轮 | 回收 | 89 | 84.61 | 4.39 | 19.27 | 0.23 |
不回收 | 9 | 13.39 | -4.39 | 19.27 | 1.44 | |
电话 | 回收 | 84 | 79.43 | 4.57 | 20.88 | 0.26 |
不回收 | 8 | 12.57 | -4.57 | 20.88 | 1.66 | |
控制 | 回收 | 86 | 94.97 | -8.97 | 80.46 | 0.85 |
不回收 | 24 | 15.03 | 8.97 | 80.46 | 5.35 |
步骤5:计算Χ2
最后,将前一列的值相加,计算卡方检验统计量(Χ2)。
如何进行独立性卡方检验
如果检验统计量足够大,那么你应该得出结论,如果变量不相关,观察到的频率不是你所期望的。但怎样才算够大呢?
我们将检验统计量与a中的临界值进行比较<一个href="//www.charpingshvac.com/statistics/chi-square-distributions/" data-wpel-link="internal">卡方分布一个>来决定它是否大到可以拒绝<一个href="//www.charpingshvac.com/statistics/null-and-alternative-hypotheses/" data-wpel-link="internal">零假设一个>这两个变量是无关的。这个过程被称为独立性卡方检验。
按照以下步骤执行独立性卡方检验(回收示例已经完成了前两步):
第一步:计算预期频率
用列联表计算<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">期望频率一个>公式如下:
第二步:计算卡方
使用皮尔逊卡方公式<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">计算检验统计量一个>:
步骤3:找到临界卡方值
你可以在a中找到临界值<一个href="//www.charpingshvac.com/statistics/chi-square-distribution-table/" data-wpel-link="internal">卡方临界值表一个>或者使用统计软件。你需要知道两个数字来找到临界值:
- 的<一个href="//www.charpingshvac.com/statistics/degrees-of-freedom/" data-wpel-link="internal">自由度一个>(df):对于独立性的卡方检验,df是(变量1组的个数−1)*(变量2组的个数−1)。
- 显著性水平(α):按照惯例,显著性水平通常是0.05。
步骤4:将卡方值与临界值进行比较
检验统计量大到足以拒绝零假设吗?将其与临界值进行比较,找出答案。
第五步:决定是否拒绝原假设
- 如果Χ2值是更大的小于临界值,则观测分布与期望分布之间的差异具有统计学意义(<一个href="//www.charpingshvac.com/statistics/p-value/" data-wpel-link="internal">p<α).
- 数据允许你这样做<一个href="//www.charpingshvac.com/statistics/hypothesis-testing/" data-wpel-link="internal">拒绝原假设一个>变量是不相关的,并为<一个href="//www.charpingshvac.com/statistics/null-and-alternative-hypotheses/" data-wpel-link="internal">备择假设一个>变量是相关的。
- 如果Χ2值是少小于临界值时,则观测分布与期望分布之间的差异无统计学意义(p>α).
- 这些数据不允许你拒绝零假设,即变量是不相关的,也不支持备用假设,即变量是相关的。
第六步:进行事后测试(可选)
如果任何一个变量中有超过两组,而你拒绝了零假设,你可能想要用事后检验进一步调查。事后测试是在初始分析之后执行的后续测试。
类似于<一个href="//www.charpingshvac.com/statistics/one-way-anova/" data-wpel-link="internal">单向方差分析一个>对于两个以上的组,显著差异并不能告诉你哪些组的比例显著不同。
一种事后的方法是使用卡方独立性检验和邦费罗尼校正对每对组进行比较。Bonferroni修正是指你把原图分开<一个href="//www.charpingshvac.com/statistics/statistical-significance/" data-wpel-link="internal">显著性水平一个>(通常是.05)通过您正在执行的测试数量。
何时使用不同的测试
有几个测试类似于独立性卡方检验,所以使用哪个并不总是很明显。最佳选择取决于你的变量、样本大小和假设。
何时使用卡方拟合优度检验
皮尔逊卡方检验有两种类型。独立性卡方检验就是其中之一,还有<一个href="//www.charpingshvac.com/statistics/chi-square-goodness-of-fit/" data-wpel-link="internal">卡方拟合优度检验一个>是另一个。这两个测试的数学方法是相同的——主要的区别是如何计算期望值。
你应该用卡方拟合优度检验一个分类变量,你想测试一个<一个href="//www.charpingshvac.com/methodology/hypothesis/" data-wpel-link="internal">假设一个>对其分布.
什么时候用费雪精确检验法
如果样本量较小(N< 100),费雪精确检验是更好的选择。当你的数据不满足时,你应该特别选择费雪精确检验<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">条件一个>在每个组合组中预期至少有5个观察值。
何时使用McNemar测试
你应该使用<一个href="//www.charpingshvac.com/statistics/chi-square-tests/" data-wpel-link="internal">McNemar检验法检验一个>当你有一个关系密切一对分类变量,每个变量有两组。它允许你测试变量的比例是否相等。这种测试最常用于比较同一个体观察前后的情况。
何时使用G测验
一个G检验和卡方检验给出了大致相同的结果。G测试可以适应更复杂的情况<一个href="//www.charpingshvac.com/methodology/experimental-design/" data-wpel-link="internal">实验设计一个>而不是卡方检验。然而,这些测试通常是可互换的,选择主要是个人喜好的问题。
偏爱卡方检验的一个原因是,大多数领域的研究人员都更熟悉卡方检验。
实践问题
你想测试一下卡方拟合优度检验的知识吗?用下面的按钮下载我们的练习题和例子。
关于独立性卡方检验的常见问题
- 如何在Excel中进行独立性卡方检验?
-
您可以使用CHISQ.TEST ()函数执行<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">独立性卡方检验一个>在Excel中。它需要两个参数,CHISQ。TEST(observed_range, expected_range),并返回p价值。
- 如何在R中进行卡方独立性检验?
-
您可以使用chisq.test ()函数执行<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">独立性卡方检验一个>给出列联表作为x参数的矩阵。例如:
M =矩阵(数据= c(89, 84, 86, 9, 8, 24), nrow = 3, ncol = 2)
chisq。测验(x = m)
- 卡方检验有哪两种主要类型?
-
两个主要的<一个href="//www.charpingshvac.com/statistics/chi-square-distributions/" data-wpel-link="internal">卡方测试一个>是<一个href="//www.charpingshvac.com/statistics/chi-square-goodness-of-fit/" data-wpel-link="internal">卡方拟合优度检验一个>和<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">独立性卡方检验一个>.
- 卡方分布有什么性质?
-
一个<一个href="//www.charpingshvac.com/statistics/chi-square-distributions/" data-wpel-link="internal">卡方分布是一个<一个href="//www.charpingshvac.com/statistics/probability-distributions/" data-wpel-link="internal">连续概率分布一个>.卡方分布的形状取决于它<一个href="//www.charpingshvac.com/statistics/degrees-of-freedom/" data-wpel-link="internal">自由度一个>,k.卡方分布的均值等于其自由度(k)及<一个href="//www.charpingshvac.com/statistics/variance/" data-wpel-link="internal">方差一个>是2k.范围是0到∞。
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。