聚类抽样|一个简单的一步一步的指南与示例
在整群抽样,研究人员将人口分成更小的小组,叫做集群.然后他们在这些簇中随机选择形成一个样本.
聚类抽样是一种方法概率抽样这通常用于研究大群体,特别是那些地理分布广泛的人群。研究人员通常使用已有的单位,如学校或城市作为他们的集群。
如何聚类样本
聚类抽样最简单的形式是单段整群抽样.它包括4个关键步骤。
步骤1:定义用户群体
与其他形式的抽样一样,你必须首先清楚地定义你想要研究的总体。
步骤2:将你的样本划分成簇
这是整个过程中最重要的部分。集群的质量以及它们在多大程度上代表更大的总体决定有效性你的结果。理想情况下,您希望您的集群满足以下条件:
- 每个集群的种群应该尽可能多样化。你希望整个群体的每个潜在特征都能在每个聚类中表示出来。
- 每个聚类的分布特征应与整个人口的分布特征相似。
- 总的来说,这些集群应该覆盖整个人口。
- 集群之间没有任何重叠(即相同的人员或单位不会出现在多个集群中)。
理想情况下,每个集群应该是整个种群的一个迷你代表。然而,在实践中,聚类往往不能完美地代表总体的特征,这就是为什么这种方法提供的统计确定性低于简单随机抽样,并且更容易研究偏见就像选择性偏差.
由于集群通常是自然形成的群体,如学校、城市或家庭,因此它们往往比整个人口更具同质性。在进行研究时,您应该意识到这一点,因为这可能会影响其有效性。
步骤3:随机选择集群作为示例
如果每个聚类本身是较大总体的一个迷你表示,那么从聚类中随机选择和抽样可以让您模仿简单的随机抽样,这反过来又支持结果的有效性。
相反,如果群集不具有代表性,那么随机抽样将允许您收集不同群集阵列上的数据,这仍然应该为您提供总体的概述。
步骤4:从样本中收集数据
然后进行研究,并从所选集群中的每个单元收集数据。
多级整群抽样
在多级整群抽样,而不是从所选聚类中的每个单元收集数据,而是从聚类中随机选择单个单元作为样本。
然后,您可以从这些单独的单元中收集数据-这就是所谓的双级抽样.
你也可以继续这个过程,取越来越小的随机样本,这通常被称为多级抽样.
当测试整个集群不可行或成本太高时,您应该使用这种方法。
优点和缺点
整群抽样因其实用的优点而被广泛采用,但在统计效度方面存在一些缺点。
优势
- 整群抽样是时间和成本效率高的,特别是对于在地理上分布广泛的样本,否则很难正确抽样。
- 由于聚类抽样采用随机抽样,如果总体正确地聚类,您的研究将具有较高的可信度外部效度因为你的样本会反映更大群体的特征。
缺点
- 内部效度没有简单的随机抽样强,特别是当您使用更多阶段的聚类时。
- 如果你的聚类不能很好地代表整个群体,那么依赖你的样本来提供有效结果就会更加困难,而且很可能是这样有偏见的.
- 聚类抽样比其他形式的抽样要复杂得多。
关于聚类抽样的常见问题
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。