均值是什么?|如何找到它&例子
的的意思是(又名算术平均数,不同于几何平均数)是所有值的和除以值的总数。这是最常用的测量方法集中趋势通常被称为“平均水平”。
总体和样本的平均公式
在研究中,你经常从样品并执行推论统计来了解它们来自哪个种群。
样本均值和总体均值的公式仅在数学符号上有所不同。总体属性使用大写字母,而示例属性使用小写字母。
总体均值
总体平均公式 | 解释 |
---|---|
|
总体均值也可以表示为μ。
样本均值
样本均值公式 | 解释 |
---|---|
|
样本均值也被称为米.
计算平均数的步骤
计算平均值有两个步骤:
- 把数据集中的所有值加起来。
- 用这个数除以值的数目。
我们将使用一个示例数据集来完成这些步骤。
假设你想知道你附近的人在餐馆吃饭的平均花费。你问8个邻居他们上次出去吃饭花了多少钱,然后求出平均花费。
两人晚餐费用(美元) | 42 | 13 | 31 | 87 | 24 | 58 | 76 | 69 |
---|
步骤1:把这些值加起来,求它们的和
因为我们处理的是样本,所以我们使用样本公式。
公式 | 计算 |
---|---|
42 + 13 + 31 + 87 + 24 + 58 + 76 + 69 =400 |
步骤2:将和除以值的数目
在公式中,n是数据集中的值的数目。我们的数据集有8个值。
公式 | 计算 |
---|---|
= 8 = 400 = 400 8 =50 |
均值告诉我们,在我们的样本中,参与者在餐馆账单上平均花费了50美元。
平均值的离群值效应
离群值是与数据集中大多数值不同的极值。因为所有的值都被用于计算平均值,一个异常值可以通过使平均值远离大多数值而对平均值产生巨大的影响。
看看加上an后,均值会怎样离群值对我们的数据集。
两人晚餐费用(美元) | 42 | 13 | 31 | 87 | 24 | 58 | 76 | 69 | 230 |
---|
步骤1:把这些值加起来,求它们的和
公式 | 计算 |
---|---|
42 + 13 + 31 + 87 + 24 + 58 + 76 + 69 + 230 =630 |
步骤2:将和除以值的数目
公式 | 计算 |
---|---|
= 9 = 630 = 630 9 =70 |
正如我们所看到的,仅仅向我们的数据集中添加一个异常值就将平均值提高了20美元。在这种情况下,一种不同的集中趋势的测量方法,比如中位数,会更合适。
什么时候可以使用平均值、中值或众数?
平均数是最广泛使用的集中趋势的度量,因为它在计算中使用了所有的值。集中趋势的最佳测量方法取决于你的变量类型以及分布的形状。
变量类型
平均值只能计算定量变量(如身高),而不能计算分类变量(如性别)。
在分类变量中,数据被分组,没有精确的数值,因此无法计算平均值。对于分类变量,模式是集中趋势的最佳衡量标准,因为它告诉你样本中最常见的特征或最受欢迎的选择。
但是对于连续的或离散变量,你有精确的数值。有了这些,你可以很容易地计算出平均值或中位数。
分布的形状
均值是最好的数据集正态分布.在正态分布中,数据是对称分布的斜.大多数值都聚集在一个中心区域周围,当值离中心越远时,值就越小。
正态分布的均值、众数和中位数是完全相同的。
在倾斜分布中,更多的值落在中心的一边,而不是另一边,平均值、中位数和众数都彼此不同。一边的尾巴更分散、更长,一端的分数比另一端少。
对于偏态分布和有异常值的分布,平均值容易受到极端值的影响,可能不能准确地代表集中趋势。的中位数是这些分布的一个更好的度量,因为它从分布的中间取一个值。
或者,您可以系统地回顾和删除离群值中的数据集数据清理的过程。
关于平均数的常见问题
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。