统计检验的主要假设是什么?
统计测试通常假设:
- 数据是正态分布的
- 被比较的两组有相似之处方差
- 数据是独立的
如果您的数据不符合这些假设,您可能仍然可以使用非参数统计检验,它们的要求更少,但推论也更弱。
概率是相对频率经过无数次的试验。
例如,一枚硬币正面朝上的概率是。5,这意味着如果你将硬币投掷无限次,它有一半的概率是正面朝上的。
因为做一件事无限次是不可能的,所以相对频率常被用来估计概率。如果你抛一枚硬币1000次,得到507个正面,相对频率。507是一个很好的概率估计。
您可以使用CHISQ.INV.RT ()函数来查找卡方Excel中的临界值。
例如,计算测试的卡方临界值df= 22和α = .05,单击任何空白单元格并键入:
= CHISQ.INV.RT (0.05, 22)
您可以使用qchisq ()函数来查找卡方R中的临界值。
例如,计算测试的卡方临界值df= 22, α = .05:
Qchisq (p = .05, df = 22,较低。tail = FALSE)
您可以使用chisq.test ()函数执行独立性卡方检验给出列联表作为x参数的矩阵。例如:
M =矩阵(数据= c(89, 84, 86, 9, 8, 24), nrow = 3, ncol = 2)
chisq。te年代t(x= m)
您可以使用CHISQ.TEST ()函数执行独立性卡方检验在Excel中。它需要两个参数,CHISQ。TEST(observed_range, expected_range),并返回p价值。
卡方拟合优度检验通常用于遗传学。一个常见的应用是检查两个基因是否相连(即,如果分类是独立的)。当基因相连时,一个基因的遗传等位基因会影响另一个基因的遗传等位基因。
假设你想知道豌豆质地(R =圆形,R =褶皱)和颜色(Y =黄色,Y =绿色)的基因是否相关。在两个杂合子(RY / RY)豌豆植物。你在实验中测试的假设是:
你观察100颗豌豆:
为了计算期望值,你可以做一个庞尼特方格。如果这两个基因没有连锁,那么每个基因型组合的概率是相等的。
变化中 | 变化中 | 变化中 | 变化中 | |
变化中 | RRYY | RrYy | RRYy | RrYY |
变化中 | RrYy | rryy | Rryy | rrYy |
变化中 | RRYy | Rryy | RRyy | RrYy |
变化中 | RrYY | rrYy | RrYy | rrYY |
因此,预期的表型比例为9个圆形和黄色:3个圆形和绿色:3个皱褶和黄色:1个皱褶和绿色。
由此,你可以计算出100个豌豆的预期表型频率:
表型 | 观察到的 | 预期 |
圆形和黄色 | 78 | 100 * (9/16) = 56.25 |
又圆又绿 | 6 | 100 * (3/16) = 18.75 |
皱皱发黄 | 4 | 100 * (3/16) = 18.75 |
皱巴巴的绿色 | 12 | 100 * (1/16) = 6.21 |
表型 | 观察到的 | 预期 | O−E | (O−E)2 | (O−E)2/ E |
圆形和黄色 | 78 | 56.25 | 21.75 | 473.06 | 8.41 |
又圆又绿 | 6 | 18.75 | −12.75 | 162.56 | 8.67 |
皱皱发黄 | 4 | 18.75 | −14.75 | 217.56 | 11.6 |
皱巴巴的绿色 | 12 | 6.21 | 5.79 | 33.52 | 5.4 |
Χ2= 8.41 + 8.67 + 11.6 + 5.4 = 34.08
因为有四组(圆形和黄色,圆形和绿色,褶皱和黄色,褶皱和绿色),所以有三组自由度.
对于α = .05和的显著性检验df= 3,则Χ2临界值为7.82。
Χ2= 34.08
临界值= 7.82
的Χ2值大于临界值.
的Χ2值大于临界值,所以我们拒绝零假设,即后代群体遗传所有可能的基因型组合的概率相等。观察到的基因型频率与预期的基因型频率之间存在显著差异(p< . 05)。
这些数据支持了另一种假设,即后代遗传所有可能的基因型组合的概率并不相等,这表明这些基因是相连的
您可以使用chisq.test ()函数执行卡方拟合优度检验在“x”参数中给出观测值,在“p”参数中给出期望值,并设置“rescale”。P "变为真。例如:
chisq。te年代t(x= c(22,30,23), p = c(25,25,25), rescale.p = TRUE)
要找到四分位数对于概率分布,你可以使用分布的分位数函数。
您可以使用quantile()函数来查找四分位数如果你的数据被称为“data”,那么“quantile(data, prob=c(.25,.5,.75), type=1)”将返回三个四分位数。
您可以使用QUARTILE()函数来查找四分位数在Excel中。如果您的数据在列A中,则单击任何空白单元格,为第一个四分位数键入“=QUARTILE(A:A,1)”,为第二个四分位数键入“=QUARTILE(A:A,2)”,为第三个四分位数键入“=QUARTILE(A:A,3)”。
您可以使用皮尔森()函数来计算皮尔逊相关系数在Excel中。如果变量位于列A和列B中,则单击任何空白单元格并键入“PEARSON(A:A,B:B)”。
没有函数可以直接检验相关性的显著性。
您可以使用和()函数来计算皮尔逊相关系数要测试相关性的显著性,可以使用cor.test ()函数。
当(1)关系是线性的,(2)两个变量都是定量的,(3)正态分布,(4)没有异常值时,您应该使用皮尔逊相关系数。
的皮尔逊相关系数(r)是测量线性相关性最常用的方法。它是一个介于-1和1之间的数字,用来衡量两个变量之间关系的强度和方向。
的e在泊松分布公式代表数字2.718。这个数叫做欧拉常数。你可以简单地代入e当你在计算泊松概率时。欧拉常数是一个非常有用的数字,在微积分中尤其重要。
的备择假设常缩写为H一个或H1.当用数学符号写备择假设时,它总是包含一个不等式符号(通常≠,但有时<或>)。
的零假设常缩写为H0.当零假设用数学符号来写时,它总是包含一个相等符号(通常是=,但有时≥或≤)。
的t分布是由统计学家威廉·西利·戈塞特以“学生”的笔名首次描述的。
您可以使用T.INV ()函数求的临界值t用于Excel中的单侧测试,您可以使用T.INV.2T ()函数用于双尾测试。
您可以使用qt ()函数求的临界值t函数给出了的临界值t对于单侧检验。如果你想知道的临界值t对于双尾测试,将显著性水平由两个。
可以使用summary()函数查看R²你会在输出的底部附近看到“r平方”。
整理你的缺失的数据,您的选择通常包括接受、删除或重新创建丢失的数据。
相关系数总是在-1和1之间。
系数的符号告诉你关系的方向:正值意味着变量在同一个方向上一起变化,而负值意味着它们在相反的方向上一起变化。
一个数的绝对值等于不带符号的数。相关系数的绝对值告诉你相关性的大小:绝对值越大,相关性越强。
如果要使用这些数据,则必须满足这些假设皮尔森的r:
一个相关系数是描述变量之间关系的强度和方向的单个数字。
不同类型的相关系数可能适用于您的数据测量水平而且分布.的皮尔逊积矩相关系数r)通常用于评估两个定量变量之间的线性关系。
一个数据集通常可以没有模态、一个模态或多个模态——这完全取决于有多少不同的值重复频率最高。
你的数据可以是:
两种最常用的计算方法四分位范围是排他性和包容性的方法。
排他性方法在识别Q1和Q3时排除中位数,而包容性方法在识别四分位数时将中位数作为数据集中的一个值。
对于每一种方法,你都需要不同的步骤来找到中位数,Q1和Q3,这取决于你的样本容量是偶数还是奇数。排他性方法最适用于偶数样本量,而包容性方法通常用于奇数样本量。
的置信水平是如果您再次运行实验或以相同方式重新对总体进行采样,您期望接近相同估计值的次数百分比。
的置信区间由您期望在给定置信水平下找到的估计的上界和下界组成。
例如,如果你根据婴儿随机样本估计每年出生的女婴平均比例的95%置信区间,你可能会发现上界为0.56,下界为0.48。这些是置信区间的上界和下界。置信水平为95%。
的值,或阈值统计显著性,是任意的-你使用哪个值取决于你的研究领域。
在大多数情况下,研究人员使用的alpha值为0.05,这意味着在零假设下出现被测数据的概率小于5%。
您使用的检验统计量将由统计检验确定。
你可以选择正确的统计检验通过查看您收集的数据类型以及您想要测试的关系类型。
在统计学中,模型选择是研究人员用来比较不同统计模型的相对值,并确定哪一个最适合观察到的数据的过程。
的赤池信息标准是最常用的模型选择方法之一。AIC将模型预测观测数据的能力与模型达到该精度水平所需的参数数量进行加权。
AIC模型选择可以帮助研究人员找到一个模型,解释他们的数据中观察到的变化,同时避免过拟合。
的赤池信息标准由模型的最大对数似然和用于达到该似然的参数数量(K)计算得出。AIC函数为2K - 2(对数似然).
AIC值越低表明模型拟合越好,delta-AIC(两个AIC值之间的差值)大于-2的模型被认为明显优于与之比较的模型。
多元线性回归是一种回归模型,用一条直线估计一个定量因变量和两个或多个自变量之间的关系。
回归模型是一种统计模型,用于估计一个依赖项之间的关系变量和一个或多个自变量使用一条线(或在两个或多个自变量的情况下一个平面)。
当因变量是定量的时,可以使用回归模型,但在逻辑回归的情况下,因变量是二进制的。
一个单样本t检验用于将单个人口与标准值进行比较(例如,确定特定城镇的平均寿命是否与全国平均寿命不同)。
一个配对t检验是用来比较某一特定人群之前和之后的实验干预或在两个不同的时间点进行干预(例如,在教授材料之前和之后测量学生在测试中的表现)。
你的选择学习任务取决于你研究的是一组还是两组,以及你是否关心组均值差异的方向。
如果你在研究一个群体,使用配对t检验为了比较一段时间内或干预后的组均值,或使用单样本t检验将组均值与标准值进行比较。如果你研究的是两组人,使用a两个示例学习任务.
如果您只想知道是否存在差异,请使用双尾检验.如果你想知道一组均值大于或小于另一组,使用左尾或右尾单侧检验.
我们的团队通过以下方式帮助学生毕业:
Scribbr擅长编辑与研究相关的文件.我们校对:
的Scribbr剽bob综合app官网窃检查是由元素驱动的Turnitin的相似性检查器,即抄袭检测软件和互联网档案和优质学术出版物内容数据库.
的Scribbr引文生成器是用开源开发的吗引用风格语言(CSL)项目和弗兰克·贝内特的citeproc-js.它与其他几十种流行引用工具使用的技术相同,包括Mendeley和Zotero。bobapp官方下载
您可以在我们的公共访问中找到所有在Scribbr引文生成器中使用的引用风格和地区Github上的存储库.