研究中的4种可靠性|定义和例子

可靠性告诉您一个方法度量某物的一致性如何。当你用同样的方法样本在相同的条件下,你应该得到相同的结果。如果不是,测量方法可能是不可靠的或偏见可能偷偷溜进了你的研究。

可靠性主要有四种类型。每一个都可以通过比较用同一方法产生的不同结果集来估计。

可靠性类型 测量…的一致性
两次试验法的 同样的测试结束时间
评分者间信 同样的测试由不同的人进行
平行的形式 不同版本一个测试被设计成是等效的。
内部一致性 个别项目测试的。

两次试验法的可靠性

测试-重测信度衡量的是在不同时间点对同一样本重复相同测试时结果的一致性。当你测量一些你希望在样本中保持不变的东西时,你就会用到它。

针对见习飞行员申请人的色盲测试应该具有较高的测试重测可靠性,因为色盲是一种不会随着时间而改变的特征。

为什么它很重要

许多因素会在不同的时间点影响你的结果:例如,受访者可能会经历不同的情绪,或者外部条件可能会影响他们准确回应的能力。

测试-再测试的可靠性可以用来评估一个方法在一段时间内抵抗这些因素的能力。两组结果的差异越小,重测信度越高。

如何衡量

为了测量测试-再测试的可靠性,您在两个不同的时间点对同一组人进行相同的测试。然后计算相关在两组结果之间。

测试-再测试可靠性示例

你设计了一份问卷来测量一组参与者的智商(一个不太可能随着时间的推移而发生显著变化的属性)。你隔两个月对同一组人进行测试,但结果有显著差异,所以智商问卷的测试重测可靠性很低。

提高测试-再测试的可靠性

  • 当设计测试或调查问卷试着以一种不受参与者情绪或注意力影响的方式来制定问题、陈述和任务。
  • 当计划你的数据收集方法,尽量减少外部因素的影响,并确保所有样品在相同的条件下进行测试。
  • 记住变化或者回忆偏倚可以预期的发生在参与者随着时间的推移,并把这些考虑在内。

评分者间信度

评价者之间的信度(也称为观察者之间的信度)衡量的是观察或评估同一事物的不同人之间的一致程度。当研究人员收集数据并对一个或多个数据进行评级、得分或分类时,可以使用它变量,它可以帮助缓解观察者偏见

在一项观察性研究中,一组研究人员收集课堂行为的数据,评分者之间的可靠性很重要:所有的研究人员应该就如何对不同类型的行为进行分类或评分达成一致。

为什么它很重要

人是主观的,所以不同的观察者对情况和现象的感知自然是不同的。可靠的研究旨在尽可能减少主观性,以便不同的研究人员可以复制相同的结果。

在设计数据收集的尺度和标准时,重要的是要确保不同的人对同一变量的评分一致且最低偏见.当有多个研究人员参与时,这一点尤其重要数据收集或分析。

如何衡量

为了测量评分者之间的信度,不同的研究人员对同一样本进行相同的测量或观察。然后计算不同结果集之间的相关性。如果所有的研究人员给出相似的评分,则该测试具有较高的评分者间信度。

等级间可靠性示例

一组研究人员观察了患者伤口愈合的过程。为了记录愈合的阶段,使用评分量表,并使用一套标准来评估伤口的各个方面。不同研究人员对同一组患者的评估结果进行比较,各组结果之间具有很强的相关性,因此该测试具有较高的评分间信度。

提高评分者之间的可靠性

  • 清楚地定义变量和用于测量它们的方法。
  • 制定详细的、客观的标准,以便对变量进行评级、计数或分类。
  • 如果涉及多个研究人员,确保他们都有完全相同的信息和培训。

防止抄袭,运行免费检查。

免费尝试

平行形式可靠性

平行形式信度衡量的是一个测试的两个等效版本之间的相关性。当你有两种不同的评估工具或一组旨在衡量同一件事情的问题时,你就会使用它。

为什么它很重要

如果您想使用多个不同版本的测试(例如,为了避免应答者根据记忆重复相同的答案),您首先需要确保所有的问题集或测量结果都是可靠的。

在教育评估中,通常有必要创建不同版本的测试,以确保学生无法提前接触到问题。平行形式的可靠性意味着,如果同一个学生参加两个不同版本的阅读理解测试,他们应该在两个测试中得到相似的结果。

如何衡量

衡量平行形式可靠性的最常用方法是提出大量问题来评估同一事物,然后将这些问题随机分为两个问题集。

同一组受访者回答了这两组问题,然后计算结果之间的相关性。二者相关性高,表明并行表单可靠性高。

并行表单可靠性示例

制定了一组问题来衡量一组受访者的金融风险厌恶程度。问题随机分为两组,受访者随机分为两组。两组人都参加两项测试:A组先参加测试A, B组先参加测试B。比较了两种试验的结果,结果基本一致,表明并行形式具有较高的可靠性。

提高并行表单的可靠性

  • 确保所有的问题或测试项目都基于相同的理论,并制定了衡量相同的东西。

内部一致性

内部一致性评估相关在测试中用于测量相同结构的多个项目之间。

你可以在不重复测试或不涉及其他研究人员的情况下计算内部一致性,所以当你只有一个数据集时,这是评估可靠性的好方法。

为什么它很重要

当你设计一组问题或评分,并将其组合成总分时,你必须确保所有的项目都反映了相同的内容。如果对不同项目的回答相互矛盾,测试可能不可靠。

为了衡量客户对在线商店的满意度,您可以创建一份问卷,其中包含一组受访者必须同意或不同意的陈述。内部一致性告诉你这些报表是否都是可靠的客户满意度指标。

如何衡量

两种常用的方法用于测量内部一致性。

  • 平均项目间相关性:对于一组旨在评估相同结构的度量,您计算所有可能项目对的结果之间的相关性,然后计算平均值。
  • 分半信度:你随机地把一组测量分成两组。在测试整个应答者集之后,您可以计算两个应答集之间的相关性。
内部一致性示例

研究人员向一组受访者提供了一组旨在衡量乐观和悲观心态的陈述。他们必须在1到5的范围内评价他们对每个陈述的同意程度。如果测试是内在一致的,乐观的受访者通常应该给予乐观指标高评级和悲观指标低评级。我们计算了所有对“乐观”陈述的回答之间的相关性,但相关性非常弱。这表明测试具有较低的内部一致性。

提高内部一致性

  • 在设计问题或测量方法时要小心:那些旨在反映相同概念的问题或测量方法应该基于相同的理论并仔细制定。

哪种类型的可靠性适用于我的研究?

重要的是,考虑可靠性时,规划您的研究设计收集和分析数据,撰写研究报告。应计算的可靠性类型取决于研究类型和你的方法

我的方法是什么? 哪种形式的可靠性是相关的?
测量您希望随时间保持不变的属性。 两次试验法的
多个研究人员对同一主题进行观察或评级。 评分者间信
用两种不同的测试来衡量同一件事。 平行的形式
使用多项目测试,其中所有项目都旨在测量相同的变量。 内部一致性

如果可能和相关,你应该统计计算可靠性,并在你的简历中说明这一点结果

关于可靠性类型的常见问题

信度和效度的区别是什么?

信度和效度都是关于一个方法度量某物的好坏:

  • 可靠性一致性衡量一种措施(在相同条件下是否能重现结果)。
  • 有效性精度衡量(结果是否真的代表了他们应该衡量的东西)。

如果你在做实验研究,你还必须考虑内部有效性和外部有效性你的实验。

我如何在我的研究中减少观察者的偏见?

你可以使用几种策略来最小化观察者偏见

  • 使用掩蔽(模板)为了隐藏你研究的目的不让所有人看到。
  • 由三角形组成的你的数据不同数据收集方法或源。
  • 使用多个观察者并确保评分者之间的可靠性。
  • 火车你的观察员要确保他们之间的数据记录一致。
  • 标准化你的观察程序,以确保它们是结构化和清晰的。
为什么再现性和可复制性很重要?

再现性和可复制性是相关术语。

  • 一个成功的繁殖表明数据分析是在公平和诚实的方式下进行的。
  • 一个成功的复制这表明可靠性结果是很高的。
为什么研究中的偏见是一个问题?

研究偏见影响有效性而且可靠性你的研究发现,导致错误的结论和对真相的误解。这可能会对医学研究等领域产生严重影响,例如,可能会评估一种新的治疗形式。

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

米德尔顿,F.(2022年11月30日)。研究中的4种可靠性|定义和例子。Scribbr。检索于2022年12月14日,来自//www.charpingshvac.com/methodology/types-of-reliability/

这篇文章有用吗?
霏欧纳米德尔顿

菲奥娜自2016年8月以来一直在Scribbr编辑。她拥有地质学学士学位,目前正在攻读海洋科学硕士学位。她喜欢与来自世界各地的学生一起工作,以完善他们的写作。
Baidu