卡方拟合优度检验|公式,指南和示例
一个卡方检验(Χ2)拟合优度检验是皮尔逊综合症的一种<一个href="//www.charpingshvac.com/statistics/chi-square-tests/" data-wpel-link="internal">卡方检验一个>.您可以使用它来测试观察到的分类变量的分布是否与您的期望不同。
卡方拟合优度检验告诉你一个统计模型与一组观察值的拟合程度。它经常被用来<一个href="//www.charpingshvac.com/frequently-asked-questions/how-do-i-perform-a-chi-square-goodness-of-fit-test-for-a-genetic-cross/" data-wpel-link="internal">分析遗传杂交一个>.
卡方拟合优度检验是什么?
卡方(Χ2)拟合优度测试是一个拟合优度测试<一个href="//www.charpingshvac.com/methodology/types-of-variables/" data-wpel-link="internal">分类变量一个>.拟合优度是衡量统计模型拟合一组观测值的程度。
- 当拟合优度为高,基于模型的期望值为接近观测值。
- 当拟合优度为低,基于模型的期望值为远离观测值。
采用卡方拟合优度检验分析的统计模型为分布.它们可以是任何分布,从简单到所有组的概率相等,到复杂到a<一个href="//www.charpingshvac.com/statistics/probability-distributions/" data-wpel-link="internal">概率分布一个>有很多参数。
假设检验
卡方拟合优度检验是a<一个href="//www.charpingshvac.com/statistics/hypothesis-testing/" data-wpel-link="internal">假设检验.它允许你<一个href="//www.charpingshvac.com/statistics/inferential-statistics/" data-wpel-link="internal">得出结论一个>关于a的分布<一个href="//www.charpingshvac.com/methodology/population-vs-sample/" data-wpel-link="internal">人口一个>基于一个样本。使用卡方拟合优度检验,您可以测试拟合优度是否“足够好”,从而得出总体遵循分布的结论。
使用卡方拟合优度检验,你可以问这样的问题:这个样本是从一个有……
- 雄性和雌性海龟比例相等?
- 红色,蓝色,黄色,绿色和紫色糖豆的比例相等?
- 90%的人是右撇子,10%的人是左撇子?
- 后代继承所有可能的基因型组合(即无连锁基因)的概率相等?
- 一个<一个href="//www.charpingshvac.com/statistics/poisson-distribution/" data-wpel-link="internal">泊松分布一个>每年的洪水?
- 一个<一个href="//www.charpingshvac.com/statistics/normal-distribution/" data-wpel-link="internal">正态分布一个>面包价格?
卡方拟合优度检验假设
与所有假设检验一样,卡方拟合优度检验评估两个假设:零假设和备择假设。它们是对“样本是否来自遵循特定分布的总体?”这个问题的两个相互竞争的答案。
这些是适用于所有卡方拟合优度检验的一般假设。你应该通过描述“特定的分布”使你的假设更具体。您可以命名概率分布(例如泊松分布)或给出每个组的期望比例。
何时使用卡方拟合优度检验
如果你想进行卡方拟合优度测试,以下条件是必要的:
- 你想验证一个关于分布的假设一个分类变量.如果变量是<一个href="//www.charpingshvac.com/methodology/types-of-variables/" data-wpel-link="internal">连续一个>,您可以通过将观察值分隔为区间来将其转换为分类变量。这个过程被称为数据装箱。
- 的样本随机选择从<一个href="//www.charpingshvac.com/methodology/population-vs-sample/" data-wpel-link="internal">人口一个>.
- 有一个预计至少有五次观察在每一组中。
如何计算检验统计量(公式)
的<一个href="//www.charpingshvac.com/statistics/test-statistic/" data-wpel-link="internal">检验统计量一个>对于卡方(Χ2)拟合优度检验为皮尔逊卡方:
- 卡方检验是统计量吗
- 是求和运算符(它的意思是“取的和”)
- 为观测频率
- 是期望频率
观察值与预期值之间的差异越大(O−E在方程中),卡方越大。
要使用这个公式,请遵循以下五个步骤:
步骤1:创建表
在两列中创建一个表,其中包含观察到的和预期的频率。
味道 | 观察到的 | 预期 |
大蒜爆炸 | 22 | 25 |
蓝莓的喜悦 | 30. | 25 |
薄荷味咀嚼 | 23 | 25 |
2 .计算O−E
添加一个名为"O−E”。用观测到的频率减去期望的频率。
味道 | 观察到的 | 预期 | O−E |
大蒜爆炸 | 22 | 25 | 22−25 =−3. |
蓝莓的喜悦 | 30. | 25 | 5 |
薄荷味咀嚼 | 23 | 25 | −2 |
第三步:计算(O−E)2
添加一个名为“(”的新列O−E)2”。将前一列的值平方。
味道 | 观察到的 | 预期 | O−E | (O−E)2 |
大蒜爆炸 | 22 | 25 | −3. | (−3)2= 9 |
蓝莓的喜悦 | 30. | 25 | 5 | 25 |
薄荷味咀嚼 | 23 | 25 | −2 | 4 |
第四步:计算(O−E)2/E
添加最后一列“(O−E²/E”。将前一列除以期望频率。
味道 | 观察到的 | 预期 | O−E | (O−E)2 | (O−E²/E |
大蒜爆炸 | 22 | 25 | −3. | 9 | 9/25 = 0.36 |
蓝莓的喜悦 | 30. | 25 | 5 | 25 | 1 |
薄荷味咀嚼 | 23 | 25 | −2 | 4 | 0.16 |
步骤5:计算Χ2
把前一列的值加起来。这是卡方检验统计量(Χ)2).
味道 | 观察到的 | 预期 | O−E | (O−E)2 | (O−E)2/E |
大蒜爆炸 | 22 | 25 | −3. | 9 | 9/25 = 0.36 |
蓝莓的喜悦 | 30. | 25 | 5 | 25 | 1 |
薄荷味咀嚼 | 23 | 25 | −2 | 4 | 0.16 |
Χ2= 0.36 + 1 + 0.16 = 1.52
如何进行卡方拟合优度检验
卡方统计量是一种拟合优度的度量,但它本身并不能告诉你太多。例如,is Χ2= 1.52一个低或高的拟合优度?
为了解释卡方拟合优度,你需要将它与某个东西进行比较。这就是卡方检验:将卡方值与适当的卡方分布进行比较,以决定是否<一个href="//www.charpingshvac.com/statistics/hypothesis-testing/" data-wpel-link="internal">拒绝原假设一个>.
要执行卡方拟合优度测试,请遵循以下五个步骤(对于狗粮示例,前两个步骤已经完成):
第一步:计算预期频率
有时,计算期望频率是最困难的一步。仔细考虑哪些期望值最适合你<一个href="//www.charpingshvac.com/statistics/null-and-alternative-hypotheses/" data-wpel-link="internal">零假设一个>.
一般来说,你需要用每一组的期望比例乘以观察总数来得到期望频率。
第二步:计算卡方
使用卡方公式从观察到的和期望的频率中计算卡方值。
步骤3:找到临界卡方值
求a中的临界卡方值<一个href="//www.charpingshvac.com/statistics/chi-square-distribution-table/" data-wpel-link="internal">卡方临界值表一个>或者使用统计软件。临界值由卡方分布计算。为了找到临界卡方值,你需要知道两件事:
- 的<一个href="//www.charpingshvac.com/statistics/degrees-of-freedom/" data-wpel-link="internal">自由度一个>(df):对于卡方拟合优度检验df就是基团数减1。
- 显著性水平(α):按照惯例,显著性水平通常是0.05。
步骤4:将卡方值与临界值进行比较
将卡方值与临界值进行比较,以确定哪个更大。
第五步:决定是否拒绝原假设
- 如果Χ2值是更大的小于临界值,则观测分布与期望分布之间的差异具有统计学意义(p<α).
- 数据允许你拒绝零假设,并为备择假设提供支持。
- 如果Χ2值是少小于临界值时,则观测分布与期望分布之间的差异无统计学意义(p>α).
- 数据不允许你拒绝零假设也不支持备择假设。
何时使用不同的测试
是否使用卡方拟合优度检验或相关检验取决于你想检验的假设和你拥有的变量类型。
何时使用独立性卡方检验
还有另一种卡方检验,叫做<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">独立性卡方检验一个>.
- 如果有,就用卡方拟合优度检验一个分类变量一个>你想验证一个关于它的假设<一个href="//www.charpingshvac.com/statistics/nominal-data/" data-wpel-link="internal">分布.
- 如果有,就用卡方检验两个分类变量,你想测试一个关于它们的假设的关系.
何时使用不同的拟合优度检验
的Anderson-Darling而且Kolmogorov-Smirnov拟合优度检验是分布的另外两个常见的拟合优度检验。
- 使用Anderson-Darling或Kolmogorov-Smirnov拟合优度测试当你有<一个href="//www.charpingshvac.com/methodology/types-of-variables/" data-wpel-link="internal">连续变量一个>(你不想扔掉的)。
- 当你有一个分类变量(或一个你想要收纳的连续变量)时,使用卡方拟合优度检验。
练习问题和例子
你想测试一下卡方拟合优度检验的知识吗?用下面的按钮下载我们的练习题和例子。
卡方拟合优度检验的常见问题
- 如何在Excel中进行卡方拟合优度检验?
-
您可以使用CHISQ.TEST ()函数执行<一个href="//www.charpingshvac.com/statistics/chi-square-goodness-of-fit/" data-wpel-link="internal">卡方拟合优度检验一个>在Excel中。它需要两个参数,CHISQ。TEST(observed_range, expected_range),并返回<一个href="//www.charpingshvac.com/frequently-asked-questions/what-is-a-p-value/" data-wpel-link="internal">p价值一个>.
- 如何在R中进行卡方拟合优度检验?
-
您可以使用chisq.test ()函数执行<一个href="//www.charpingshvac.com/statistics/chi-square-goodness-of-fit/" data-wpel-link="internal">卡方拟合优度检验一个>在“x”参数中给出观测值,在“p”参数中给出期望值,并设置“rescale”。P "变为真。例如:
chisq。test(x = c(22,30,23), p = c(25,25,25), rescale.p = TRUE)
- 如何对基因杂交进行卡方拟合优度检验?
-
卡方拟合优度检验通常用于遗传学。一个常见的应用是检查两个基因是否相连(即,如果分类是独立的)。当基因相连时,一个基因的遗传等位基因会影响另一个基因的遗传等位基因。
假设你想知道豌豆质地(R =圆形,R =褶皱)和颜色(Y =黄色,Y =绿色)的基因是否相关。在两个杂合子(RY / RY)豌豆植物。你在实验中测试的假设是:
你观察100颗豌豆:
- 78颗圆形和黄色的豌豆
- 6颗圆形的绿色豌豆
- 4颗皱巴巴的黄豌豆
- 12颗皱巴巴的青豆
第一步:计算预期频率
为了计算期望值,你可以做一个庞尼特方格。如果这两个基因没有连锁,那么每个基因型组合的概率是相等的。
变化中 变化中 变化中 变化中 变化中 RRYY RrYy RRYy RrYY 变化中 RrYy rryy Rryy rrYy 变化中 RRYy Rryy RRyy RrYy 变化中 RrYY rrYy RrYy rrYY 因此,预期的表型比例为9个圆形和黄色:3个圆形和绿色:3个皱褶和黄色:1个皱褶和绿色。
由此,你可以计算出100个豌豆的预期表型频率:
表型 观察到的 预期 圆形和黄色 78 100 * (9/16) = 56.25 又圆又绿 6 100 * (3/16) = 18.75 皱皱发黄 4 100 * (3/16) = 18.75 皱巴巴的绿色 12 100 * (1/16) = 6.21 第二步:计算卡方
表型 观察到的 预期 O−E (O−E)2 (O−E)2/ E 圆形和黄色 78 56.25 21.75 473.06 8.41 又圆又绿 6 18.75 −12.75 162.56 8.67 皱皱发黄 4 18.75 −14.75 217.56 11.6 皱巴巴的绿色 12 6.21 5.79 33.52 5.4 Χ2= 8.41 + 8.67 + 11.6 + 5.4 = 34.08
步骤3:找到临界卡方值
因为有四组(圆形和黄色,圆形和绿色,褶皱和黄色,褶皱和绿色),所以有三组<一个href="//www.charpingshvac.com/statistics/degrees-of-freedom/" data-wpel-link="internal">自由度一个>.
对于α = .05和的显著性检验df= 3,则Χ2临界值为7.82。
步骤4:将卡方值与临界值进行比较
Χ2= 34.08
临界值= 7.82
的Χ2值大于临界值.
第五步:决定是否拒绝原假设
的Χ2值大于临界值,所以我们拒绝零假设,即后代群体遗传所有可能的基因型组合的概率相等。观察到的基因型频率与预期的基因型频率之间存在显著差异(p< . 05)。
这些数据支持了另一种假设,即后代遗传所有可能的基因型组合的概率并不相等,这表明这些基因是相连的
- 卡方检验有哪两种主要类型?
-
两个主要的<一个href="//www.charpingshvac.com/statistics/chi-square-distributions/" data-wpel-link="internal">卡方测试一个>是<一个href="//www.charpingshvac.com/statistics/chi-square-goodness-of-fit/" data-wpel-link="internal">卡方拟合优度检验一个>和<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">独立性卡方检验一个>.
- 卡方分布有什么性质?
-
一个<一个href="//www.charpingshvac.com/statistics/chi-square-distributions/" data-wpel-link="internal">卡方分布是一个<一个href="//www.charpingshvac.com/statistics/probability-distributions/" data-wpel-link="internal">连续概率分布一个>.卡方分布的形状取决于它<一个href="//www.charpingshvac.com/statistics/degrees-of-freedom/" data-wpel-link="internal">自由度一个>,k.卡方分布的均值等于其自由度(k)及<一个href="//www.charpingshvac.com/statistics/variance/" data-wpel-link="internal">方差一个>是2k.范围是0到∞。
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。