什么是内容有效性?|定义和示例

内容效度评估一个仪器(如测试)覆盖所有相关部分的程度构造它的目的是测量。在这里,一个构造是一种理论概念、主题或想法:特别是通常不能直接测量的概念。

内容有效性是四种类型之一测量的有效性.其他三个是:

  • 表面有效性:测试的内容是否适合它的目的?
  • 效标效度:这些结果是否准确地衡量了它们被设计用来衡量的具体结果?
  • 建构效度测试是否测量了它想要测量的概念?
例如:考试中的内容有效性
笔试测试个人是否具备足够的理论知识来获得驾驶执照。如果考试的题目涵盖了与交通规则相关的所有可能的主题,那么考试的内容效度就很高。与此同时,它还应该排除所有与驾照无关的其他问题。

内容有效性示例

一些构造是直接可见或有形的,因此更容易测量。例如,高度以英寸为单位。其他结构更难测量。例如,抑郁由几个维度组成,不能直接测量。

例如:心理学中的内容效度
心理学研究通常涉及开发筛选工具,以确定临床诊断的指标。假设你有兴趣开发一个衡量抑郁症临床病例的量表。

在制定抑郁量表时,研究人员必须确定该量表是否涵盖了与抑郁结构相关的所有维度,还是只涵盖了其中的一部分。例如,如果一个提议的抑郁量表只涵盖抑郁症的行为方面,而忽略了包括情感第一,它缺乏内容有效性,有风险研究偏见

此外,为了实现内容有效性,必须有一定程度的普遍共识,例如专家之间,关于特定的内容是什么构造代表。

例子:智商测试中的内容效度
尽管几十年来智商测试一直被用来评估智力,但它们经常被批评没有考虑到人类智力的复杂性及其许多不同的组成部分。

研究表明,智力至少由三个不同的组成部分组成:短期记忆、推理和语言能力。

这意味着现有的智商测试并不能充分覆盖构成人类智力的所有维度。为此,需要三个单独的测试来测试每个维度。因此,这些测试被认为具有较低的内容效度。

结构与内容有效性的例子

建构效度和内容效度很容易混淆,但它们是根本不同的概念。

建构效度评估一个测试度量它所要度量的内容的程度。如果构念的任何部分缺失了,或者包含了不相关的部分,构念的有效性就会打折扣。请记住,为了建立结构有效性,您必须同时证明两者收敛而且发散性(或鉴别性)有效性

  • 聚合效度显示为度量特定构造而设计的测试是否与评估相同构造的其他测试相关联。
  • 发散性(或鉴别性)有效性显示两个测试是否应该彼此高度相关的其实是不相关的。测量两种不同结构的两个测试的分数之间应该没有什么关系。
请注意
如果你在指挥实验研究,你也应该也考虑内部 有效性自信的程度因果关系存在),外部效度(普遍性结果)。

另一方面,内容效度应用于您在其中创建测试或问卷调查对于一个特定的构造并且要确保这些问题实际上衡量了你想要它们衡量的东西。

示例:内容有效性
假设您正在研究一个社区的卫生需求调查

  • 高内容效度:如果您的调查问题涵盖了健康需求的所有维度,即身体、心理、社会和环境,那么您的问卷将具有较高的内容效度。
  • 内容效度低:如果忽略了卫生需求的某些方面,结果可能无法准确反映社区卫生需求。
  • 高收敛效度:如果您的调查问题的答案与现有的健康需求调查的答案相关联,那么这表明您的测量可能具有较高的构造效度。但是,请务必记住,为了证明结构的有效性,您必须进行演示这两个收敛和发散(或判别)有效性。
  • 低鉴别效度:如果你的大多数调查问题与现有的人口对卫生服务态度的测量方法密切相关,那么结果可能不再是社区卫生需求的有效测量方法。换句话说,你的调查似乎衡量了与预期(健康需求)不同的结构(态度)。因此,其构念效度较低。

在这两种情况下,问卷调查内容效度很低。

分步指南:如何衡量内容有效性

正确地测量内容效度是很重要的——高的内容效度分数表明构造测量准确。您可以按照下面的分步指南来衡量内容有效性:

第一步:从专家那里收集数据

衡量内容有效性需要由主题专家(sme)组成的评审团提供意见。在这里,sme是处于评估测试内容的最佳位置的人。

例如,学校数学考试的专家小组将由教授该学科的合格数学教师组成。

对于每个单独的问题,小组必须评估由问题测量的组件是否“必要的”,“有用的,但不是必要的”,或者对于测量结构“不必要的”。

小组成员对某一特定项目的重要性的认同程度越高,该项目的内容有效性水平就越高。

请注意
作为一名学生,你可能没有机会接触专家小组。或者也许你正在写论文,你的小组评审正好发生在你的答辩上。在这样的一些情况下,你可以用你的同事来代替。一定要在试卷上记下来。

步骤2:计算内容效度比

接下来,您可以使用下面的公式来计算内容效度(CVR)对于每个问题:

内容效度比= (ne - N/2) / (N/2)
地点:

  • =表示“必不可少”的中小企小组成员数目
  • N=中小企业小组成员总数
举例:计算内容效度比
假设你让一个由五名专家组成的小组评估一个由七个问题组成的诊断测试。第一个问题被评为“必不可少”四位专家。

第一个问题的内容效度比计算公式为:

内容效度= (ne−N/2) / (N/2) =(4−5/2)/ (5/2)= 0.6

内容有效性表

使用相同的公式,计算每个问题的CVR。

请注意,该公式产生的值范围为+1到−1。高于0的值表明至少有一半的中小企业认为这个问题是必要的。越接近+1,内容效度越高。

然而,一致可能是由于巧合。为了排除这种可能性,可以使用临界值表在下面。根据专家小组中专家的数量,内容效度(CVR)对于给定的问题不应低于一个最小值,也称为临界值。

小组成员人数 临界值
5 0.99
6 0.99
7 0.99
8 0.75
9 0.78
10 0.62
11 0.59
12 0.56
20. 0.42
30. 0.33
40 0.29

步骤3:计算内容效度指数

要衡量整个测试的内容效度,您需要计算内容有效性指数(CVI).CVI是测试中所有问题的平均CVR分数。请记住,接近1的值表示较高的内容有效性。

计算内容有效性指数(CVI),你取七个问题的所有CVR分数的平均值。

这里是:

CVI =(0.6 + 0.2−0.2 + 0.2−0.2 + 0.6 + 1)/ 7 = 0.31

将CVI与由5名专家组成的小组的临界值(0.99)进行比较,您会注意到CVI太低。这意味着测试不能准确地测量您的意图。为了获得更高的CVI,你决定改进CVR较低的问题。

以下是学生们喜欢Scribbr校对服务的原因

发现校对和编辑

关于内容有效性的常见问题

内容效度和表面效度在哪些方面相似?

表面有效性而且内容效度相似之处在于它们都评估测试内容的合适程度。区别在于表面有效性是主观的,在表面上评估内容。

当一次考验已经坚强表面效度,任何人都会同意,测试的问题似乎衡量了他们想要衡量的东西。

例如,在四年级的数学考试中,学生们必须做加法和乘法,大多数人会认为它有很强的说服力表面有效性(也就是说,它看起来像一个数学测试)。

另一方面,内容效度评估一个测试如何很好地代表一个主题的所有方面。内容效度的评估更加系统,依赖于专家评价。对于每个问题,分析每个问题是否涵盖了测试设计要涵盖的方面。

四年级的数学考试会有高内容效度如果它涵盖了那个年级教的所有技能。专家(在这种情况下,数学老师)必须通过将测试与学习目标进行比较来评估内容效度。

内容效度和构念效度的区别是什么?

建构效度指的是测试对其设计用来测量的概念(或结构)的测量程度。评估建构效度当你在研究那些无法量化和/或无形的概念时,比如内向,这一点尤其重要。以确保建构效度你的测试应该基于已知的内向指标(操作化).

另一方面,内容效度评估测试如何很好地表示结构的所有方面。如果缺失某些方面或包含不相关的部分,则测试的内容效度较低。

为什么内容有效性很重要?

内容效度向您展示了测试或其他测量方法如何准确地挖掘您正在研究的特定结构的各个方面。

换句话说,它帮助您回答这个问题:“测试是否度量了我想度量的结构的所有方面?”如果答案是肯定的,那么测试的内容效度就很高。

内容效度越高,构念的测量越准确。

如果测试未能包含构造的部分,或者包含不相关的部分,则有效性仪器受到了威胁,这让你的结果受到了质疑。

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

Nikolopoulou, K.(2022, 11月30日)。什么是内容有效性?|定义和示例。Scribbr。检索于2022年12月14日,来自//www.charpingshvac.com/methodology/content-validity/

这篇文章有用吗?
Kassiani Nikolopoulou

Kassiani拥有传播学、生物经济和循环经济的学术背景。作为一名前记者,她喜欢将复杂的科学信息转化为易于获取的文章,以帮助学生。
Baidu