研究中的4种可靠性|定义和例子
可靠性告诉您一个方法度量某物的一致性如何。当你用同样的方法样本在相同的条件下,你应该得到相同的结果。如果不是,测量方法可能是不可靠的或偏见可能偷偷溜进了你的研究。
可靠性主要有四种类型。每一个都可以通过比较用同一方法产生的不同结果集来估计。
可靠性类型 | 测量…的一致性 |
---|---|
两次试验法的 | 同样的测试结束时间. |
评分者间信 | 同样的测试由不同的人进行人. |
平行的形式 | 不同版本一个测试被设计成是等效的。 |
内部一致性 | 的个别项目测试的。 |
两次试验法的可靠性
测试-重测信度衡量的是在不同时间点对同一样本重复相同测试时结果的一致性。当你测量一些你希望在样本中保持不变的东西时,你就会用到它。
为什么它很重要
许多因素会在不同的时间点影响你的结果:例如,受访者可能会经历不同的情绪,或者外部条件可能会影响他们准确回应的能力。
测试-再测试的可靠性可以用来评估一个方法在一段时间内抵抗这些因素的能力。两组结果的差异越小,重测信度越高。
如何衡量
为了测量测试-再测试的可靠性,您在两个不同的时间点对同一组人进行相同的测试。然后计算相关在两组结果之间。
测试-再测试可靠性示例
你设计了一份问卷来测量一组参与者的智商(一个不太可能随着时间的推移而发生显著变化的属性)。你隔两个月对同一组人进行测试,但结果有显著差异,所以智商问卷的测试重测可靠性很低。
提高测试-再测试的可靠性
- 当设计测试或调查问卷试着以一种不受参与者情绪或注意力影响的方式来制定问题、陈述和任务。
- 当计划你的数据收集方法,尽量减少外部因素的影响,并确保所有样品在相同的条件下进行测试。
- 记住变化或者回忆偏倚可以预期的发生在参与者随着时间的推移,并把这些考虑在内。
评分者间信度
评价者之间的信度(也称为观察者之间的信度)衡量的是观察或评估同一事物的不同人之间的一致程度。当研究人员收集数据并对一个或多个数据进行评级、得分或分类时,可以使用它变量,它可以帮助缓解观察者偏见.
为什么它很重要
人是主观的,所以不同的观察者对情况和现象的感知自然是不同的。可靠的研究旨在尽可能减少主观性,以便不同的研究人员可以复制相同的结果。
在设计数据收集的尺度和标准时,重要的是要确保不同的人对同一变量的评分一致且最低偏见.当有多个研究人员参与时,这一点尤其重要数据收集或分析。
如何衡量
为了测量评分者之间的信度,不同的研究人员对同一样本进行相同的测量或观察。然后计算不同结果集之间的相关性。如果所有的研究人员给出相似的评分,则该测试具有较高的评分者间信度。
等级间可靠性示例
一组研究人员观察了患者伤口愈合的过程。为了记录愈合的阶段,使用评分量表,并使用一套标准来评估伤口的各个方面。不同研究人员对同一组患者的评估结果进行比较,各组结果之间具有很强的相关性,因此该测试具有较高的评分间信度。
提高评分者之间的可靠性
- 清楚地定义变量和用于测量它们的方法。
- 制定详细的、客观的标准,以便对变量进行评级、计数或分类。
- 如果涉及多个研究人员,确保他们都有完全相同的信息和培训。
平行形式可靠性
平行形式信度衡量的是一个测试的两个等效版本之间的相关性。当你有两种不同的评估工具或一组旨在衡量同一件事情的问题时,你就会使用它。
为什么它很重要
如果您想使用多个不同版本的测试(例如,为了避免应答者根据记忆重复相同的答案),您首先需要确保所有的问题集或测量结果都是可靠的。
如何衡量
衡量平行形式可靠性的最常用方法是提出大量问题来评估同一事物,然后将这些问题随机分为两个问题集。
同一组受访者回答了这两组问题,然后计算结果之间的相关性。二者相关性高,表明并行表单可靠性高。
并行表单可靠性示例
制定了一组问题来衡量一组受访者的金融风险厌恶程度。问题随机分为两组,受访者随机分为两组。两组人都参加两项测试:A组先参加测试A, B组先参加测试B。比较了两种试验的结果,结果基本一致,表明并行形式具有较高的可靠性。
提高并行表单的可靠性
- 确保所有的问题或测试项目都基于相同的理论,并制定了衡量相同的东西。
内部一致性
内部一致性评估相关在测试中用于测量相同结构的多个项目之间。
你可以在不重复测试或不涉及其他研究人员的情况下计算内部一致性,所以当你只有一个数据集时,这是评估可靠性的好方法。
为什么它很重要
当你设计一组问题或评分,并将其组合成总分时,你必须确保所有的项目都反映了相同的内容。如果对不同项目的回答相互矛盾,测试可能不可靠。
如何衡量
两种常用的方法用于测量内部一致性。
- 平均项目间相关性:对于一组旨在评估相同结构的度量,您计算所有可能项目对的结果之间的相关性,然后计算平均值。
- 分半信度:你随机地把一组测量分成两组。在测试整个应答者集之后,您可以计算两个应答集之间的相关性。
内部一致性示例
研究人员向一组受访者提供了一组旨在衡量乐观和悲观心态的陈述。他们必须在1到5的范围内评价他们对每个陈述的同意程度。如果测试是内在一致的,乐观的受访者通常应该给予乐观指标高评级和悲观指标低评级。我们计算了所有对“乐观”陈述的回答之间的相关性,但相关性非常弱。这表明测试具有较低的内部一致性。
提高内部一致性
- 在设计问题或测量方法时要小心:那些旨在反映相同概念的问题或测量方法应该基于相同的理论并仔细制定。
哪种类型的可靠性适用于我的研究?
重要的是,考虑可靠性时,规划您的研究设计收集和分析数据,撰写研究报告。应计算的可靠性类型取决于研究类型和你的方法.
我的方法是什么? | 哪种形式的可靠性是相关的? |
---|---|
测量您希望随时间保持不变的属性。 | 两次试验法的 |
多个研究人员对同一主题进行观察或评级。 | 评分者间信 |
用两种不同的测试来衡量同一件事。 | 平行的形式 |
使用多项目测试,其中所有项目都旨在测量相同的变量。 | 内部一致性 |
如果可能和相关,你应该统计计算可靠性,并在你的简历中说明这一点结果.
关于可靠性类型的常见问题
- 信度和效度的区别是什么?
-
信度和效度都是关于一个方法度量某物的好坏:
如果你在做实验研究,你还必须考虑内部有效性和外部有效性你的实验。
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。