赤池信息准则|何时及如何使用(示例)

赤池信息准则(AIC)是一种数学方法,用于评估模型与生成它的数据的拟合程度。在统计数据, AIC用于比较不同的可能模型,并确定哪个模型最适合数据。AIC由以下公式计算:

  • 的数量独立变量用于构建模型。
  • 模型的最大似然估计(模型再现数据的程度)。

根据AIC的最佳拟合模型是使用尽可能少的自变量来解释最大数量的变化的模型。

赤池信息准则实例
你想知道喝含糖饮料是否会影响体重。您从一项全国健康调查中收集了二手数据,其中包括对含糖饮料消费、年龄、性别和BMI(身体质量指数)的观察。

为了找出这些变量中哪些对预测含糖饮料消费量和体重之间的关系很重要,您创建了几个可能的模型,并使用AIC进行比较。

何时使用AIC

在统计学中,AIC最常用于模型选择。通过计算和比较几种可能模型的AIC分数,可以选择最适合数据的模型。

检验假设,你可能会收集数据变量你不确定的事情,尤其是当你在探索一个新想法的时候。你想知道你测量的哪个自变量能解释你的因变量

找出答案的一个好方法是创建一组模型,每个模型都包含您测量的自变量的不同组合。这些组合应该基于:

  • 你对学习系统的了解——避免使用参数它们在逻辑上是没有联系的,因为你几乎可以在任何事物之间找到虚假的相关性!
  • 你的实验设计-例如,如果你在测试对象中划分了两种治疗方法,那么可能没有理由测试两种治疗方法之间的相互作用。

一旦创建了几个可能的模型,就可以使用AIC对它们进行比较。AIC分数越低越好,AIC会惩罚使用更多参数的模型。因此,如果两个模型解释相同数量的变化,参数较少的那个模型AIC得分较低,将是更适合的模型。

模型选择示例
在一项关于学习时间和考试形式(多项选择题和书面答案)如何影响考试成绩的研究中,您创建了两个模型:

  1. 最终测试分数与学习时间相对应
  2. 根据学习时间+考试形式计算最终考试成绩

你会发现r2是0.45p价值模型1小于0.05,r2是0.46p模型2的值小于0.05。模型2对数据的拟合稍好一些——但是仅仅为了模型拟合的这一点增加而增加另一个参数值得吗?

你运行一个AIC测试来找出答案,结果显示模型1的AIC分数较低,因为它需要更少的信息来预测几乎完全相同的精度水平。另一种思考方式是,模型2中精度的提高可能是偶然发生的。

从AIC测试中,你决定模型1是你学习的最佳模型。

如何比较模型使用AIC

AIC通过最大似然估计和模型中参数(自变量)的数量来确定模型的相对信息值。AIC公式为:

$AIC = 2K - 2ln(L)$

K是否使用了自变量的数量和l是对数似然估计(也就是模型可能产生你观察到的y值的可能性)。默认K总是2,所以如果你的模型使用一个自变量,你的K将是3,如果它使用两个自变量,你的K将是4,依此类推。

要比较使用AIC的模型,您需要计算每个模型的AIC。如果一个模型比另一个模型低2个AIC单位以上,则认为它明显优于另一个模型。

如果你有你的模型的对数似然,你可以很容易地手工计算AIC,但计算对数似然是复杂的!大多数统计软件都会包含计算AIC的功能。我们将使用R来运行AIC分析。

接收关于语言、结构和格式的反馈

专业编辑校对和编辑您的论文,重点:

  • 学术风格
  • 模糊的句子
  • 语法
  • 风格的一致性

请看例子

R中的AIC

要比较多个模型,您可以首先创建要比较的完整模型集,然后运行aictab ()在片场。

对于含糖饮料数据,我们将创建一组模型,其中包括三个预测变量(年龄、性别和饮料消费量)的各种组合。下载数据集并在R中运行代码行,自己尝试一下。

下载样例数据集

创建模型

首先,我们可以测试每个变量是如何单独执行的。

的年龄。Mod <- lm(bmi ~年龄,data = bmi.data)性别。Mod <- lm(bmi ~性别,data = bmi.data)消费。Mod <- lm(bmi ~消耗量,data = bmi.data)

接下来,我们想知道在不包括饮料消费量的情况下,年龄和性别的组合是否能更好地描述BMI的变化。

年龄。性别。mod <- lm(bmi ~年龄+性别,data = bmi.data)

我们还想知道,年龄、性别和饮料消费量的组合是否比之前的任何模型都能更好地描述BMI的变化。

组合。Mod <- lm(bmi ~年龄+性别+消费,data = bmi.data)

最后,我们可以检查年龄、性别和饮料消费量的相互作用是否可以比之前的任何模型更好地解释BMI。

交互。Mod <- lm(bmi ~年龄*性别*消费,data = bmi.data)

比较模型

要比较这些模型并找到最适合数据的模型,可以将它们放在一个列表中,并使用aictab()命令一次性比较所有模型。要使用aictab(),首先加载AICcmodavg库。

install.packages (AICcmodavg)库(AICcmodavg)

然后将模型放入一个列表(' models ')和名称(标签),这样AIC表更容易阅读(' model.names ')。

模型<- list(年龄。国防部,性。国防部,消费。国防部,age.sex。国防部,组合。model.names <- c('age. Mod)国防部”、“性。国防部”、“消费。国防部”、“age.sex。国防部”、“组合。国防部”、“interaction.mod”)

最后,运行aictab ()来做比较。

aictab(萤石。Set = models, modnames = model.names)

解读结果

上面的代码将产生以下输出表:

AIC模型选择在R。

最合适的模型总是列在前面。模型选择表包括以下信息:

  • K:模型中参数的个数。默认K为2,因此只有一个参数的模型的K为2 + 1 = 3。
  • AICc:模型的信息得分(小写的“c”表示该值是根据小样本量校正的AIC检验计算出来的)。AIC值越小,模型拟合越好。
  • Delta_AICc:最佳模型与被比较模型的AIC得分差值。在该表中,次优模型与顶级模型相比delta-AIC为6.33,第三优模型与顶级模型相比delta-AIC为17.57。
  • AICcWt: AICc权重,它是被评估模型中包含的全套模型所提供的预测能力总量的比例。在这种情况下,顶层模型包含了全部模型中所能找到的全部解释的96%。
  • 那么一点点。Wt: AICc权重之和。在这里,前两个模型包含100%的累积AICc重量。
  • :对数似。这是描述给定数据的模型的可能性的值。AIC分数是根据LL和K计算出来的。

从这个表中我们可以看到,最好的模型是组合模型-模型包括所有参数,但没有相互作用(bmi ~年龄+性别+消费)。

该模型比其他所有模型都好得多,因为它承载了96%的累积模型权重,AIC得分最低。次优模型比最佳模型(6.33个单元)高2个AIC单位以上,且仅占累计模型重量的4%。

基于这种比较,我们将选择组合模型用于我们的数据分析。

报告结果

如果你在你的研究中使用AIC模型选择,你可以在你的论文中说明这一点方法部分你的论文论文,或研究论文.报告你使用AIC模型选择,简要解释你找到的最适合的模型,并说明模型的AIC权重。

示例方法部分
我们使用AIC模型选择来区分描述年龄、性别、加糖饮料消费和体重指数之间关系的一组可能模型。最佳拟合模型占累计模型权重的96%,包含了所有没有交互影响的参数。

在找到最合适的模型之后,您可以继续运行模型并评估结果。模型评估的输出可以在结果部分你的论文。

关于AIC的常见问题

赤池信息标准是什么?

赤池信息标准是一种数学测试,用于评估模型与它要描述的数据的拟合程度。它会惩罚使用较多的模型独立变量(参数)来避免过拟合。

AIC最常用来比较所考虑的不同模型之间的相对拟合优度,然后选择最适合数据的模型。

什么是模型?

在统计学中,模型是一个或多个的集合独立变量研究人员用它们预测的相互作用来解释因变量的变化。

类型可以测试模型统计检验.要比较不同模型对数据的拟合程度,可以使用赤池的信息标准用于型号选择。

什么是模型选择?

在统计学中,模型选择是研究人员用来比较不同统计模型的相对值,并确定哪一个最适合观察到的数据的过程。

赤池信息标准是最常用的模型选择方法之一。AIC将模型预测观测数据的能力与模型达到该精度水平所需的参数数量进行加权。

AIC模型选择可以帮助研究人员找到一个模型,解释他们的数据中观察到的变化,同时避免过拟合。

AIC是如何计算的?

赤池信息标准由模型的最大对数似然和用于达到该似然的参数数量(K)计算得出。AIC函数为2K - 2(对数似然)

AIC值越低表明模型拟合越好,delta-AIC(两个AIC值之间的差值)大于-2的模型被认为明显优于与之比较的模型。

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

贝文斯,R.(2022年11月18日)。赤池信息准则|何时及如何使用(示例)。Scribbr。检索于2022年12月14日,来自//www.charpingshvac.com/statistics/akaike-information-criterion/

这篇文章有用吗?
丽贝卡·贝

丽贝卡正在攻读土壤生态学博士学位,空闲时间用来写作。她很高兴能和大家一起研究统计数据。
Baidu