统计分析初学者指南| 5步和例子
统计分析意味着调查使用的趋势、模式和关系定量数据.它是科学家、政府、企业和其他组织使用的重要研究工具。
为了得出有效的结论,统计分析需要从一开始就仔细规划研究过程.你需要明确你的假设,并对你的研究设计、样本量和抽样程序做出决定。
从样本中收集数据后,您可以使用组织和总结数据描述性统计.然后,你可以使用推论统计正式检验假设并对总体进行估计。最后,您可以解释和概括您的发现。
这篇文章是一个实用的介绍统计分析的学生和研究人员。我们将通过两个研究示例引导您完成这些步骤。第一个调查潜在的因果关系,而第二个调查潜在的因果关系相关变量之间的关系。
第一步:写下你的假设并计划你的研究设计
要收集有效数据进行统计分析,首先需要指定您的假设并计划你的研究设计。
编写统计假设
研究的目标通常是调查研究对象中变量之间的关系人口.你从一个预测开始,然后使用统计分析来检验这个预测。
统计假设是一种关于人口预测的正式形式。每一个研究预测都被重新表述零假设和替代假设可以使用样本数据进行测试。
零假设总是预测变量之间没有影响或没有关系,而备择假设陈述了你对影响或关系的研究预测。
规划你的研究设计
一个研究设计是数据收集和分析的总体策略。它决定了你以后可以用来检验你的假设的统计检验。
首先,决定你的研究将使用描述性、相关性还是实验性设计。实验直接影响变量,而描述性和相关性研究只测量变量。
- 在一个实验设计,你可以评估因果关系(例如,冥想对考试成绩的影响),使用比较或回归的统计测试。
- 在一个相关设计,你可以探索变量之间的关系(例如,父母的收入和GPA),而不需要使用相关系数和显著性检验来假设因果关系。
- 在一个描述性的设计,你可以研究一个群体或现象的特征(例如,焦虑在美国大学生中的流行),使用统计测试从样本数据中得出推论。
你的研究设计还涉及到你是在群体层面还是个人层面比较参与者,还是两者都比较。
- 在一个主题之间的设计,你比较了接受不同治疗的参与者的群体水平结果(例如,进行冥想练习的人与没有进行冥想练习的人)。
- 在一个试设计,你比较了参与研究所有治疗的参与者的重复测量(例如,在进行冥想练习之前和之后的分数)。
- 在一个混合(阶乘)设计例如,受试者之间的一个变量改变了,受试者内部的另一个变量改变了(例如,参加或没有参加冥想练习的参与者的前测和后测分数)。
测量变量
当计划一个研究设计时,你应该实施你的变量,并决定如何测量它们。
对于统计分析,重要的是要考虑测量水平你的变量,它告诉你它们包含什么类型的数据:
许多变量可以在不同的精度水平上测量。例如,年龄数据可以是定量的(8岁)或分类的(年轻)。如果一个变量是用数字编码的(例如,从1到5的一致级别),这并不意味着它是定量的而不是分类的。
确定测量水平对于选择适当的统计数据和假设检验很重要。例如,可以用定量数据计算平均分,但不能用分类数据。
在研究研究中,除了你感兴趣的变量的测量外,你还经常会收集有关参与者特征的数据。
变量 | 数据类型 |
---|---|
年龄 | 定量(比例) |
性别 | 分类(名义上的) |
种族或民族 | 分类(名义上的) |
基准测试分数 | 定量(间隔) |
期末考试成绩 | 定量(间隔) |
变量 | 数据类型 |
---|---|
父母的收入 | 定量(比例) |
平均绩点 | 定量(间隔) |
步骤2:从样本中收集数据
在大多数情况下,从每个成员中收集数据是非常困难或昂贵的人口你对学习感兴趣。相反,您将从样本中收集数据。
统计分析可以让你把你的发现应用到你自己的样本之外,只要你使用得当抽样程序.你应该瞄准一个能代表总体的样本。
统计分析抽样
选择样本有两种主要方法。
- 概率抽样:人口中的每个成员都有机会通过随机选择被选为研究对象。
- Non-probability抽样:由于方便或自愿自我选择等标准,人口中的一些成员比其他人更有可能被选为研究对象。
理论上,对于高度一般化的发现,应该使用概率抽样方法。随机选择减少了研究偏差的类型,就像抽样偏差,并确保来自样本的数据实际上是总体的典型。参数测试当使用概率抽样收集数据时,可用于做出强有力的统计推断。
但在实践中,几乎不可能收集到理想的样本。而非概率样本更有可能存在偏差的风险,比如自己挑选的偏见在美国,他们更容易招募和收集数据。非参数测试更适合于非概率样本,但它们对总体的推论较弱。
如果你想对非概率样本使用参数检验,你必须证明:
- 你的样本代表了你要推广你的发现的总体。
- 你的样本缺乏系统性偏差。
请记住外部效度意味着你只能将你的结论推广到与你的样本特征相同的其他人身上。例如,来自西方、受过良好教育、工业化、富裕和民主的样本(例如,美国大学生)的结果就不是这样自动适用所有非weird人群。
如果您将参数检验应用于来自非概率样本的数据,请务必详细说明您的结果可以在您的应用中推广到何种程度的限制讨论部分.
创建适当的抽样过程
根据你的研究可用的资源,决定你将如何招募参与者。
- 你是否有资源广泛宣传你的学习,包括在你的大学环境之外?
- 你是否有办法招募代表广泛人群的多样化样本?
- 你有时间联系和跟进那些难以接触到的小组成员吗?
计算足够的样本量
在招募参与者之前,决定你的样本大小可以参考你所在领域的其他研究,也可以使用统计学。过小的样本可能无法代表样本,而过大的样本将比必要的成本更高。
有很多样本量计算器网上。不同的公式取决于你是否有亚组或你的研究有多严格(例如,在临床研究中)。根据经验,每个子组至少需要30个单位或更多。
要使用这些计算器,你必须了解并输入这些关键组件:
- 显著性水平(alpha):拒绝一个你愿意接受的真零假设的风险,通常设置为5%。
- 统计能力:你的研究发现一定规模效应的概率(如果有的话),通常是80%或更高。
- 预期影响的大小:你的研究预期结果有多大的标准化指示,通常基于其他类似的研究。
- 总体标准差:根据先前的研究或您自己的初步研究对总体参数进行估计。
以下是学生们喜欢Scribbr校对服务的原因
第三步:用描述性统计来总结你的数据
一旦收集了所有数据,就可以检查它们并进行计算描述性统计这就是他们的总结。
检查数据
检查数据的方法有很多种,包括以下几种:
- 组织来自每个变量的数据频率分布表.
- 类中的关键变量显示数据条形图查看响应的分布情况。
- 可视化两个变量之间的关系散点图.
通过在表格和图形中可视化数据,您可以评估数据是否遵循倾斜分布或正态分布,以及是否存在异常值或缺失数据。
一个正态分布意味着您的数据对称地分布在大多数值所在的中心周围,值在尾端逐渐减少。
相反,偏态分布非对称的,一端的值比另一端多。分布的形状很重要,要记住,因为只有一些描述性统计数据应该用于倾斜分布。
极端的离群值也会产生误导性的统计数据,因此您可能需要一个系统的方法来处理这些值。
计算集中趋势的度量
的措施集中趋势描述数据集中大部分值的位置。集中趋势通常有三种主要的测量方法:
然而,根据分布的形状和测量的水平,这些测量中只有一两个可能是合适的。例如,许多人口统计特征只能用模态或比例来描述,而像反应时间这样的变量可能根本没有模态。
计算可变性的度量
的措施可变性告诉您数据集中的值是如何分布的。通常报告的变异性主要有四种测量方法:
再一次,分布的形状和测量水平应该指导您选择可变性统计。四分位间距是倾斜分布的最佳度量,而标准差和方差为正态分布提供了最佳信息。
使用您的表格,您应该检查描述性统计的单位是否具有测试前和测试后分数的可比性。例如,各组之间的方差水平是否相似?是否存在极端值?如果存在,您可能需要在执行统计测试之前识别和删除数据集中的极端异常值或转换数据。
预备考试分数 | 期末测验分数 | |
---|---|---|
的意思是 | 68.44 | 75.25 |
标准偏差 | 9.43 | 9.88 |
方差 | 88.96 | 97.96 |
范围 | 36.25 | 45.12 |
N | 30. |
从这个表格中,我们可以看到冥想练习后的平均分有所增加,并且两个分数的方差具有可比性。接下来,我们可以进行统计检验,以确定这种测试分数的提高在人群中是否具有统计学意义。
检查你是否有广泛的数据点范围是很重要的。如果你不这样做,你的数据可能会更倾向于某些群体(例如,学业成绩高的人),并且只能对一种关系做出有限的推断。
父母收入(美元) | 平均绩点 | |
---|---|---|
的意思是 | 62100年 | 3.12 |
标准偏差 | 15000年 | 0.45 |
方差 | 225000000年 | 0.16 |
范围 | 8000 - 378000 | 2.64 - -4.00 |
N | 653 |
接下来,我们可以计算相关系数并进行统计检验,以了解总体中变量之间关系的显著性。
第四步:用推论统计来检验假设或做出估计
描述样本的数字称为A统计,而描述总体的数字称为a参数.使用推论统计,可以根据样本统计量得出总体参数的结论。
在统计学中,研究人员经常使用两种主要方法(同时)进行推断。
- 估计:基于样本统计量计算总体参数。
- 假设检验:用样本检验关于总体的研究预测的正式过程。
估计
你可以从样本统计量中对总体参数进行两种类型的估计:
- 一个点估计:表示您对确切参数的最佳猜测的值。
- 一个区间估计:表示参数所在位置的最佳猜测的值范围。
如果你的目标是推断出从样本数据中报告总体特征时,最好在论文中同时使用点估计和区间估计。
当你有一个具有代表性的样本时,你可以认为样本统计量是总体参数的点估计(例如,在一个广泛的民意调查中,支持当前政府的样本比例被视为政府支持者的总体比例)。
估计中总会有错误,所以您还应该提供一个置信区间作为一个区间估计来显示点估计周围的可变性。
置信区间使用标准错误和z从标准正态分布来传达你通常期望在哪里找到总体参数。
假设检验
使用来自样本的数据,您可以测试假说关于总体变量之间的关系。假设检验首先假设零假设在总体中为真,然后使用统计检验来评估零假设是否可以被拒绝。
统计测试如果零假设成立,确定样本数据在样本数据预期分布上的位置。这些测试给出了两个主要输出:
统计检验主要有三种类型:
- 比较测试评估结果的组间差异。
- 回归测试评估变量之间的因果关系。
- 相关测试评估变量之间的关系而不假设因果关系。
统计检验的选择取决于你的研究问题、研究设计、抽样方法和数据特征。
参数测试
参数检验可以根据样本数据对总体进行强有力的推断。但是要使用它们,一些假设必须满足,并且只能使用某些类型的变量。如果您的数据违反这些假设,您可以执行适当的数据转换或使用备选非参数检验代替。
一个回归对预测变量的变化导致结果变量变化的程度进行建模。
比较测试通常比较各组的平均数。这些可能是一个样本中不同组的均值(例如,处理组和对照组),一个样本组在不同时间的均值(例如,测试前和测试后得分),或者样本均值和总体均值。
的z而且t根据样本的数量和类型以及假设,检验有子类型:
- 如果你只有一个样本想要与总体均值进行比较,使用a一个示例测试.
- 如果您有配对测量(在受试者设计中),请使用依赖(配对)样本测试.
- 如果你从两个不匹配的组中获得完全独立的测量值(受试者间设计),则使用独立(未配对)样本检验.
- 如果您希望组之间在特定方向上有差异,请使用单侧检验.
- 如果您对组间差异的方向没有任何期望,请使用双尾检验.
唯一的参数相关测试是培生的r.相关系数(r)告诉你两个定量变量之间线性关系的强度。
然而,为了测试样本中的相关性是否强大到在总体中重要,还需要执行相关系数的显著性检验,通常是at测试,获得一个p价值。该测试使用样本量来计算总体中相关系数与零的差异有多大。
第五步:解释结果
统计分析的最后一步是解释结果。
统计显著性
在假设检验中,统计显著性是形成结论的主要标准。你比较p值到设置的显著性水平(通常为0.05),以决定结果在统计上是显著的还是不显著的。
统计上显著的结果被认为不太可能仅仅由于偶然而产生。只有当零假设在总体中为真时,出现这种结果的几率才非常低。
影响的大小
统计上显著的结果并不一定意味着一项发现在现实生活中有重要的应用或临床结果。
相比之下,影响的大小表明你的结果的实际意义。重要的是要报告效应大小和你的推断统计数据,以完整地描绘你的结果。如果您正在编写一个分析,还应该报告效应大小的间隔估计APA格式论文.
决策错误
第一类和第二类错误是研究结论中的错误。第一类错误是指在零假设为真时拒绝它,而第二类错误是指在零假设为假时未能拒绝它。
您可以通过选择最佳显著性水平并确保较高的显著性水平来最小化这些错误的风险权力.然而,在这两种错误之间有一个权衡,所以一个良好的平衡是必要的。
频率论与贝叶斯统计
传统上,频率论统计强调零假设显著性检验,总是从一个真零假设的假设开始。
然而,在过去的几十年里,贝叶斯统计作为一种替代方法越来越受欢迎。在这种方法中,你使用之前的研究,根据你的预期和观察不断更新你的假设。
贝叶斯因子比较的是零假设和备择假设的证据的相对强度,而不是做出拒绝零假设或不接受零假设的结论。