什么是标准效度?|定义和示例

效标效度(或criterion-related有效性)评估测试测量其设计测量的结果的准确性。一个结果可以是一种疾病、行为或表现。并发效度衡量当前的测试变量和标准变量,而预测效度衡量未来的测试变量和标准变量。

为了建立标准有效性,您需要将测试结果与条件变量.标准变量通常被称为“金标准”测量。它们包括被广泛接受的其他测试,作为一种有效的措施构造

示例:标准有效性
一位研究人员想知道大学入学考试是否能够预测未来的学习成绩。第一学期的GPA可以作为标准变量,因为它是一个公认的学术表现衡量标准。

研究人员可以将100名学生的大学入学考试成绩与他们在大学一学期后的平均绩点进行比较。如果两项考试的分数接近,则大学入学考试具有标准效度。

当您的测试与准则变量一致时,它具有较高的准则效度。然而,标准变量很难找到。

什么是标准效度?

标准效度显示了测试与称为标准的既定比较标准的相关性。

一种测量仪器,比如问卷调查,如果其结果与其他一些公认的工具(通常称为“金标准”)的结果一致,则具有标准有效性。

黄金标准(或标准变量)衡量:

  • 相同的构造
  • 概念相关的构念
  • 概念上相关的行为或表现

当金标准存在时,评估标准有效性是一个简单的过程。例如,您可以将新问卷与已建立的问卷进行比较。在医学研究中,你可以将考试成绩与临床评估进行比较。

然而,在许多情况下,并不存在现有的黄金标准。例如,如果你想测量疼痛,没有客观的标准可以做到这一点。你必须依赖受访者告诉你的。在这种情况下,你不能达到标准有效性。

重要的是要记住,标准有效性仅与金标准或参考测量的有效性一样好。如果参考度量受到某种研究偏见,它可能会影响其他有效的度量。换句话说,针对有偏见的金本位进行测试的有效度量可能无法达到标准有效性。

同样,两种有偏差的测量也会相互印证。因此,标准有效性并不能保证一个度量实际上是有效的。它最好与其他类型的有效性

标准有效性的类型

标准有效性有两种类型。您使用哪种类型取决于获得两个度量(标准和您的测试)的时间。

  • 同时效度当测试的分数和标准变量是在同时
  • 预测效度在测量准则变量时使用吗考试成绩。

同时效度

同时效度当一个新的测试与另一个已经被认为有效的测试相关联时(称为标准测试)进行演示。一个高相关新测试与标准之间表明了并发效度。

当一种新的测量方法被创造出来,并且声称在某些方面比以前的测量方法(更客观、更快、更便宜等等)更好时,建立并发有效性就显得尤为重要。

例子:同时效度
一位心理学家想评估一项关于身体形象不满的自我报告测试。测试的同时效度可以通过比较测试的分数与同时做出的临床诊断来评估。

请记住,这种形式的有效性只能在其他标准或验证工具已经存在的情况下使用。

预测效度

预测效度在测试可以预测未来性能时进行演示。换句话说,测试必须与a相关变量这只能在将来的某个时候进行评估,在测试完成后。

对于预测标准的有效性,研究人员经常检查测试的结果如何预测相关的未来结果。例如,智商测试的结果可以用来预测未来的教育成就。根据设计,结果将在未来的某个时间点进行评估。

例子:预测效度
假设你想知道大学入学数学考试是否能预测一个学生未来在工程学习项目中的表现。

学生的平均绩点是一个被广泛接受的学术表现标志,可以用作一个标准变量。为了评估数学测试的预测有效性,您将学生在该测试中的得分与他们在工程课程第一学期后的GPA进行比较。如果考试成绩高的人在以后的学习中表现良好并取得了高GPA,那么数学测试将具有很强的预测有效性。

高相关性提供了预测有效性的证据。它表明测试可以正确地预测你假设它应该。

以下是学生们喜欢Scribbr校对服务的原因

发现校对和编辑

标准有效性示例

当研究人员希望用相同测试的不同版本取代已建立的测试时,通常使用标准效度,特别是更客观、更短或更便宜的测试。

示例:标准有效性
学校心理学家创造了一种更短形式的存在调查评估学生的拖延症。

虽然最初的测试被广泛接受为一种有效的衡量拖延的方法,但它很长,需要很多时间才能完成。因此,许多学生没有仔细考虑他们的答案就填了它。

为了评估新的、更短的测试对拖延症的评估效果,心理学家要求同一组学生同时参加新的和原来的测试。如果两个检验之间的结果相似,则新检验具有较高的准则效度。心理学家可以确信,新的测试将像原来的测试一样准确地测量拖延症。

如何衡量准则效度

评估标准效度的方法有两种:

  • 通过统计测试一种新的测量技术,根据一个独立的标准或标准来建立并发效度
  • 通过对未来表现的统计测试来建立预测效度

要被验证的度量,例如测试,应该与被认为是正在研究的结构的已建立的指示的度量相关联。这是你的标准变量。

测试分数和标准变量之间的相关性是用a来计算的相关系数,例如皮尔森的r.相关系数表示在−1和+1之间的单个值中两个变量之间的关系强度。

相关系数值的解释如下:

  • r= 1:完全正相关
  • r= 0:没有相关性。
  • r=−1:完全负相关

你可以自动计算皮尔逊的r在Excel中R、SPSS等统计软件。

检验与准则变量正相关表明检验有效。无相关或负相关表明检验和标准变量不测量相同的概念。

示例:度量标准有效性
假设你有兴趣开发自己的衡量自尊的量表。要建立标准有效性,需要将其与标准变量进行比较。

你给相同样本的受访者两种量表。两个量表的结果之间的一致程度通过相关系数表示。

计算两个测试结果之间的相关系数,并发现您的量表与现有量表(r= 0.80)。该值表明两个量表之间存在较强的正相关关系。

换句话说,你的秤准确地测量了相同的结构实施在验证的范围内。

关于标准有效性的常见问题

标准效度与构念效度有何不同?

效标效度而且建构效度这两种类型都是测量吗有效性.换句话说,它们都向您展示了一个方法度量某物有多准确。

结构效度是测试或其他测量方法测量其声称测量的东西的程度,而标准效度是测试可以预测(未来)或同时(现在)测量某些东西的程度。

结构有效性通常被认为是最重要的类型测量的有效性.你需要有表面有效性内容效度,以及准则效度,以达到构念效度。

为什么构念效度很重要?

当设计或评估一个度量时,建构效度帮助您确保您实际度量的是您感兴趣的结构。如果你没有结构有效性,你可能会在不经意间测量不相关或不同的结构,从而在你的研究中失去准确性。

结构有效性通常被认为是最重要的类型测量的有效性,因为它涵盖了所有其他类型。你需要有表面有效性内容效度,效标效度达到建构效度。

信度和效度的区别是什么?

信度和效度都是关于一个方法度量某物的好坏:

  • 可靠性一致性衡量一种措施(在相同条件下是否能重现结果)。
  • 有效性精度衡量(结果是否真的代表了他们应该衡量的东西)。

如果你在做实验研究,你还必须考虑内部有效性和外部有效性你的实验。

为什么表面有效性很重要?

表面有效性很重要,因为这是衡量整体的简单第一步有效性测试或技术的这是一种相对直观、快速和简单的方法,可以开始检查一种新的测量方法乍一看是否有用。

良好的表面效度意味着任何审查您的测量的人都说它似乎在测量它应该测量的东西。在面部效度较差的情况下,审查你的测量的人可能会对你在测量什么以及为什么要使用这种方法感到困惑。

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

Nikolopoulou, K.(2022, 11月30日)。什么是标准效度?|定义和示例。Scribbr。检索于2022年12月14日,来自//www.charpingshvac.com/methodology/criterion-validity/

这篇文章有用吗?
Kassiani Nikolopoulou

Kassiani拥有传播学、生物经济和循环经济的学术背景。作为一名前记者,她喜欢将复杂的科学信息转化为易于获取的文章,以帮助学生。
Baidu