卡方拟合优度检验|公式,指南和示例

一个卡方检验(Χ2)拟合优度检验是皮尔逊综合症的一种<一个href="//www.charpingshvac.com/statistics/chi-square-tests/" data-wpel-link="internal">卡方检验.您可以使用它来测试观察到的分类变量的分布是否与您的期望不同。

例:卡方拟合优度检验
你被一家狗粮公司雇佣,帮助他们测试三种新的狗粮口味。

你招募了一个<一个href="//www.charpingshvac.com/methodology/simple-random-sampling/" data-wpel-link="internal">随机样本然后把碗放在每只狗面前,让它们在三种口味中选择。你认为这些口味在狗狗中会同样受欢迎,每种口味大约有25只狗狗选择。

一旦你有了<一个href="//www.charpingshvac.com/methodology/experimental-design/" data-wpel-link="internal">实验结果,你计划使用卡方拟合优度检验来确定狗的口味选择的分布是否与你的预期显著不同。

卡方拟合优度检验告诉你一个统计模型与一组观察值的拟合程度。它经常被用来<一个href="//www.charpingshvac.com/frequently-asked-questions/how-do-i-perform-a-chi-square-goodness-of-fit-test-for-a-genetic-cross/" data-wpel-link="internal">分析遗传杂交

卡方拟合优度检验是什么?

卡方(Χ2)拟合优度测试是一个拟合优度测试<一个href="//www.charpingshvac.com/methodology/types-of-variables/" data-wpel-link="internal">分类变量.拟合优度是衡量统计模型拟合一组观测值的程度。

  • 当拟合优度为,基于模型的期望值为接近观测值。
  • 当拟合优度为,基于模型的期望值为远离观测值。

采用卡方拟合优度检验分析的统计模型为分布.它们可以是任何分布,从简单到所有组的概率相等,到复杂到a<一个href="//www.charpingshvac.com/statistics/probability-distributions/" data-wpel-link="internal">概率分布有很多参数。

假设检验

卡方拟合优度检验是a<一个href="//www.charpingshvac.com/statistics/hypothesis-testing/" data-wpel-link="internal">假设检验.它允许你<一个href="//www.charpingshvac.com/statistics/inferential-statistics/" data-wpel-link="internal">得出结论关于a的分布<一个href="//www.charpingshvac.com/methodology/population-vs-sample/" data-wpel-link="internal">人口基于一个样本。使用卡方拟合优度检验,您可以测试拟合优度是否“足够好”,从而得出总体遵循分布的结论。

使用卡方拟合优度检验,你可以问这样的问题:这个样本是从一个有……

  • 雄性和雌性海龟比例相等?
  • 红色,蓝色,黄色,绿色和紫色糖豆的比例相等?
  • 90%的人是右撇子,10%的人是左撇子?
  • 后代继承所有可能的基因型组合(即无连锁基因)的概率相等?
  • 一个<一个href="//www.charpingshvac.com/statistics/poisson-distribution/" data-wpel-link="internal">泊松分布每年的洪水?
  • 一个<一个href="//www.charpingshvac.com/statistics/normal-distribution/" data-wpel-link="internal">正态分布面包价格?
示例:观测频率和预期频率
经过几周的努力工作,你的狗粮实验完成了,你将数据汇编在表格中:

观察和预期狗狗口味选择的频率 味道 观察到的 预期 大蒜爆炸 22 25 蓝莓的喜悦 30. 25 薄荷味咀嚼 23 25

为了帮助可视化观察频率和预期频率之间的差异,您还可以创建一个柱状图:

bar-graph-chi-square-test-goodness-of-fit

狗粮公司的总统看着你的图表,宣布他们应该取消蒜味和薄荷味,专注于蓝莓味。“别这么快!”你告诉他。

你解释说,你的观察结果与你的预期略有不同,但差异并不大。它们可能是一种真正的口味偏好的结果,也可能是偶然的。

换句话说:你有一个样本75只狗,但你真正想了解的是人口所有的狗。这个样本是从选择这三种口味的狗中抽取的吗?

卡方拟合优度检验假设

与所有假设检验一样,卡方拟合优度检验评估两个假设:零假设和备择假设。它们是对“样本是否来自遵循特定分布的总体?”这个问题的两个相互竞争的答案。

  • 零假设H0):种群遵循指定的分布。
  • 备择假设H一个):总体没有遵循指定的分布。

这些是适用于所有卡方拟合优度检验的一般假设。你应该通过描述“特定的分布”使你的假设更具体。您可以命名概率分布(例如泊松分布)或给出每个组的期望比例。

例子:零假设和备择假设
  • 零假设(H0):狗对三种口味的选择比例相同(p1p2p3.).
  • 备择假设(H一个):狗对这三种口味的选择比例并不相等。

校对对你的论文有什么好处?

Scribbr编辑不仅纠正语法和拼写错误,还通过确保你的论文没有模糊的语言、多余的单词和尴尬的措辞来加强你的写作。

参见编辑示例

何时使用卡方拟合优度检验

如果你想进行卡方拟合优度测试,以下条件是必要的:

  1. 你想验证一个关于分布的假设一个分类变量.如果变量是<一个href="//www.charpingshvac.com/methodology/types-of-variables/" data-wpel-link="internal">连续,您可以通过将观察值分隔为区间来将其转换为分类变量。这个过程被称为数据装箱。
  2. 样本随机选择从<一个href="//www.charpingshvac.com/methodology/population-vs-sample/" data-wpel-link="internal">人口
  3. 有一个预计至少有五次观察在每一组中。
示例:卡方拟合优度测试条件
您可以使用卡方拟合优度检验来分析狗粮数据,因为所有三个条件都已满足:

  1. 你想测试一个<一个href="//www.charpingshvac.com/methodology/hypothesis/" data-wpel-link="internal">假设关于一个分类变量的分布。分类变量是狗粮的味道。
  2. 你随机招募了75只狗。
  3. 每组预期至少有5次观察。对于这三种口味的狗粮,你预计会有25次狗狗选择口味的观察。

如何计算检验统计量(公式)

的<一个href="//www.charpingshvac.com/statistics/test-statistic/" data-wpel-link="internal">检验统计量对于卡方(Χ2)拟合优度检验为皮尔逊卡方:

公式 解释 X²= \sum{\dfrac{(O-E)²}{E}
  • Χ^ 2 卡方检验是统计量吗
  • \总和 是求和运算符(它的意思是“取的和”)
  • O 为观测频率
  • E 是期望频率

观察值与预期值之间的差异越大(OE在方程中),卡方越大。

要使用这个公式,请遵循以下五个步骤:

步骤1:创建表

在两列中创建一个表,其中包含观察到的和预期的频率。

示例:步骤1
味道 观察到的 预期
大蒜爆炸 22 25
蓝莓的喜悦 30. 25
薄荷味咀嚼 23 25

2 .计算OE

添加一个名为"OE”。用观测到的频率减去期望的频率。

示例:步骤2
味道 观察到的 预期 OE
大蒜爆炸 22 25 2225 =3.
蓝莓的喜悦 30. 25 5
薄荷味咀嚼 23 25 2

第三步:计算(OE2

添加一个名为“(”的新列OE2”。将前一列的值平方。

示例:步骤3
味道 观察到的 预期 OE OE2
大蒜爆炸 22 25 3. 3)2= 9
蓝莓的喜悦 30. 25 5 25
薄荷味咀嚼 23 25 2 4

第四步:计算(OE2/E

添加最后一列“(OE²/E”。将前一列除以期望频率。

示例:步骤4
味道 观察到的 预期 OE OE2 OE²/E
大蒜爆炸 22 25 3. 9 9/25 = 0.36
蓝莓的喜悦 30. 25 5 25 1
薄荷味咀嚼 23 25 2 4 0.16

步骤5:计算Χ2

把前一列的值加起来。这是卡方检验统计量(Χ)2).

示例:步骤5
味道 观察到的 预期 OE OE2 OE2/E
大蒜爆炸 22 25 3. 9 9/25 = 0.36
蓝莓的喜悦 30. 25 5 25 1
薄荷味咀嚼 23 25 2 4 0.16

Χ2= 0.36 + 1 + 0.16 = 1.52

如何进行卡方拟合优度检验

卡方统计量是一种拟合优度的度量,但它本身并不能告诉你太多。例如,is Χ2= 1.52一个低或高的拟合优度?

为了解释卡方拟合优度,你需要将它与某个东西进行比较。这就是卡方检验:将卡方值与适当的卡方分布进行比较,以决定是否<一个href="//www.charpingshvac.com/statistics/hypothesis-testing/" data-wpel-link="internal">拒绝原假设

要执行卡方拟合优度测试,请遵循以下五个步骤(对于狗粮示例,前两个步骤已经完成):

第一步:计算预期频率

有时,计算期望频率是最困难的一步。仔细考虑哪些期望值最适合你<一个href="//www.charpingshvac.com/statistics/null-and-alternative-hypotheses/" data-wpel-link="internal">零假设

一般来说,你需要用每一组的期望比例乘以观察总数来得到期望频率。

第二步:计算卡方

使用卡方公式从观察到的和期望的频率中计算卡方值。

\{方程*}开始X ^ 2 = \总和{\ dfrac{(执着)^ 2}{E}}{方程*}\结束

步骤3:找到临界卡方值

求a中的临界卡方值<一个href="//www.charpingshvac.com/statistics/chi-square-distribution-table/" data-wpel-link="internal">卡方临界值表或者使用统计软件。临界值由卡方分布计算。为了找到临界卡方值,你需要知道两件事:

示例:寻找临界卡方值
因为有三个组(大蒜爆破,蓝莓喜悦和薄荷),所以有两个自由度。

对于α = .05和的显著性检验df= 2,则Χ2临界值为5.99。

步骤4:将卡方值与临界值进行比较

将卡方值与临界值进行比较,以确定哪个更大。

示例:卡方值与临界值的比较
Χ2= 1.52

临界值= 5.99

的Χ2值小于临界值

第五步:决定是否拒绝原假设

  • 如果Χ2值是更大的小于临界值,则观测分布与期望分布之间的差异具有统计学意义(p<α).
    • 数据允许你拒绝零假设,并为备择假设提供支持。
  • 如果Χ2值是小于临界值时,则观测分布与期望分布之间的差异无统计学意义(p>α).
    • 数据不允许你拒绝零假设也不支持备择假设。
示例:决定是否拒绝零假设
的Χ2值小于临界值。因此,您不应拒绝零假设,狗以相等比例选择三种口味。观察到的风味选择分布与预期的没有显著差异(p> . 05)。这表明狗粮的口味在狗狗群体中同样受欢迎。

你把你的发现报告给狗粮公司的总裁。根据你的发现,他决定不取消蒜味和薄荷味。喜欢这些口味的狗狗们非常感激!

何时使用不同的测试

是否使用卡方拟合优度检验或相关检验取决于你想检验的假设和你拥有的变量类型。

何时使用独立性卡方检验

还有另一种卡方检验,叫做<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">独立性卡方检验

何时使用不同的拟合优度检验

Anderson-Darling而且Kolmogorov-Smirnov拟合优度检验是分布的另外两个常见的拟合优度检验。

  • 使用Anderson-Darling或Kolmogorov-Smirnov拟合优度测试当你有<一个href="//www.charpingshvac.com/methodology/types-of-variables/" data-wpel-link="internal">连续变量(你不想扔掉的)。
  • 当你有一个分类变量(或一个你想要收纳的连续变量)时,使用卡方拟合优度检验。
请注意
也有特定分布的拟合优度检验。例如,正态性的夏皮罗-威尔克检验是一种专门用于测试的拟合优度检验<一个href="//www.charpingshvac.com/statistics/normal-distribution/" data-wpel-link="internal">正态分布

专门的拟合优度测试通常有更多<一个href="//www.charpingshvac.com/statistics/statistical-power/" data-wpel-link="internal">统计能力,所以当您感兴趣的分布有专门的测试时,它们通常是最佳选择。

练习问题和例子

你想测试一下卡方拟合优度检验的知识吗?用下面的按钮下载我们的练习题和例子。

下载Word文档<一个class="btn btn--blue ext-link" href="https://docs.google.com/document/d/1j8GlI1qVUMiEcxQH4yHgLKDQVBntH4SDinCJFB7CVq8/copy" data-wpel-link="external" target="_blank" rel="nofollow external noopener">下载谷歌doc

卡方拟合优度检验的常见问题

如何在Excel中进行卡方拟合优度检验?

您可以使用CHISQ.TEST ()函数执行<一个href="//www.charpingshvac.com/statistics/chi-square-goodness-of-fit/" data-wpel-link="internal">卡方拟合优度检验在Excel中。它需要两个参数,CHISQ。TEST(observed_range, expected_range),并返回<一个href="//www.charpingshvac.com/frequently-asked-questions/what-is-a-p-value/" data-wpel-link="internal">p价值

如何在R中进行卡方拟合优度检验?

您可以使用chisq.test ()函数执行<一个href="//www.charpingshvac.com/statistics/chi-square-goodness-of-fit/" data-wpel-link="internal">卡方拟合优度检验在“x”参数中给出观测值,在“p”参数中给出期望值,并设置“rescale”。P "变为真。例如:

chisq。test(x = c(22,30,23), p = c(25,25,25), rescale.p = TRUE)

如何对基因杂交进行卡方拟合优度检验?

卡方拟合优度检验通常用于遗传学。一个常见的应用是检查两个基因是否相连(即,如果分类是独立的)。当基因相连时,一个基因的遗传等位基因会影响另一个基因的遗传等位基因。

假设你想知道豌豆质地(R =圆形,R =褶皱)和颜色(Y =黄色,Y =绿色)的基因是否相关。在两个杂合子(RY / RY)豌豆植物。你在实验中测试的假设是:

你观察100颗豌豆:

  • 78颗圆形和黄色的豌豆
  • 6颗圆形的绿色豌豆
  • 4颗皱巴巴的黄豌豆
  • 12颗皱巴巴的青豆

第一步:计算预期频率

为了计算期望值,你可以做一个庞尼特方格。如果这两个基因没有连锁,那么每个基因型组合的概率是相等的。

变化中 变化中 变化中 变化中 变化中 RRYY RrYy RRYy RrYY 变化中 RrYy rryy Rryy rrYy 变化中 RRYy Rryy RRyy RrYy 变化中 RrYY rrYy RrYy rrYY

因此,预期的表型比例为9个圆形和黄色:3个圆形和绿色:3个皱褶和黄色:1个皱褶和绿色。

由此,你可以计算出100个豌豆的预期表型频率:

表型 观察到的 预期 圆形和黄色 78 100 * (9/16) = 56.25 又圆又绿 6 100 * (3/16) = 18.75 皱皱发黄 4 100 * (3/16) = 18.75 皱巴巴的绿色 12 100 * (1/16) = 6.21

第二步:计算卡方

表型 观察到的 预期 OE OE2 OE2/ E
圆形和黄色 78 56.25 21.75 473.06 8.41
又圆又绿 6 18.75 −12.75 162.56 8.67
皱皱发黄 4 18.75 −14.75 217.56 11.6
皱巴巴的绿色 12 6.21 5.79 33.52 5.4

Χ2= 8.41 + 8.67 + 11.6 + 5.4 = 34.08

步骤3:找到临界卡方值

因为有四组(圆形和黄色,圆形和绿色,褶皱和黄色,褶皱和绿色),所以有三组<一个href="//www.charpingshvac.com/statistics/degrees-of-freedom/" data-wpel-link="internal">自由度

对于α = .05和的显著性检验df= 3,则Χ2临界值为7.82。

步骤4:将卡方值与临界值进行比较

Χ2= 34.08

临界值= 7.82

的Χ2值大于临界值

第五步:决定是否拒绝原假设

的Χ2值大于临界值,所以我们拒绝零假设,即后代群体遗传所有可能的基因型组合的概率相等。观察到的基因型频率与预期的基因型频率之间存在显著差异(p< . 05)。

这些数据支持了另一种假设,即后代遗传所有可能的基因型组合的概率并不相等,这表明这些基因是相连的

卡方检验有哪两种主要类型?

两个主要的<一个href="//www.charpingshvac.com/statistics/chi-square-distributions/" data-wpel-link="internal">卡方测试是<一个href="//www.charpingshvac.com/statistics/chi-square-goodness-of-fit/" data-wpel-link="internal">卡方拟合优度检验和<一个href="//www.charpingshvac.com/statistics/chi-square-test-of-independence/" data-wpel-link="internal">独立性卡方检验

卡方分布有什么性质?

一个<一个href="//www.charpingshvac.com/statistics/chi-square-distributions/" data-wpel-link="internal">卡方分布是一个<一个href="//www.charpingshvac.com/statistics/probability-distributions/" data-wpel-link="internal">连续概率分布.卡方分布的形状取决于它<一个href="//www.charpingshvac.com/statistics/degrees-of-freedom/" data-wpel-link="internal">自由度k.卡方分布的均值等于其自由度(k)及<一个href="//www.charpingshvac.com/statistics/variance/" data-wpel-link="internal">方差是2k.范围是0到∞。

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

特尼,S.(2022年11月10日)。卡方拟合优度检验|公式,指南和示例。Scribbr。检索于2022年12月14日,来自//www.charpingshvac.com/statistics/chi-square-goodness-of-fit/

这篇文章有用吗?
Baidu