泊松分布|定义,公式和例子
一个泊松分布是离散的概率分布。它给出了一个事件发生一定次数的概率(k)在给定的时间或空间内。
泊松分布只有1参数λ (λ)这是的意思是事件个数。下图显示了具有不同λ值的泊松分布的例子。
泊松分布是什么?
泊松分布是一个离散的概率分布,这意味着它给出了A的概率离散(即可数的)结果。对于泊松分布,离散的结果是事件发生的次数,用k表示。
您可以使用泊松分布来预测或解释在给定的时间或空间间隔内发生的事件的数量。“事件”可以是任何事情,从疾病病例到客户购买到流星撞击。间隔可以是任何特定的时间或空间,例如10天或5平方英寸。
你可以使用泊松分布,如果:
- 个别事件是随机和独立发生的。也就是说,一个事件的概率不会影响另一个事件的概率。
- 你知道的意思是次数:在给定的时间或空间间隔内发生的事件的数量这个数字被称为λ (lambda),它被假设为常数。
当事件遵循泊松分布时,λ是你计算某一事件发生一定次数的概率所需要知道的唯一东西。
泊松分布的例子
一般来说,泊松分布通常适用于计数数据。计数数据由非负整数(即用于计数的数字,如0、1、2、3、4等)组成。
马踢死
泊松分布最早的应用之一是由统计学家Ladislaus Bortkiewicz提出的。在19世纪后期,他调查了普鲁士军队士兵被马踢死的意外事件。他分析了10个军团20年的数据,相当于一个军团200年的观测数据。
下面的直方图显示了与Bortkiewicz观察到的相似的模拟数据:
他发现的意思是每年每个军团有0.61名士兵死于马踢。然而,大多数时候,没有士兵死于马踢。另一方面,在悲惨的一年里,同一个兵团有四名士兵死于马踢。
使用现代术语:
- 被马踢死是“事件”。
- 时间间隔为一年。
- 每个时间间隔的平均事件数λ为0.61。
- 某一年因马踢死的人数是k。
Bortkiewicz观察到的陆军是一个样本占普鲁士军队总人数的一半因为随机的本质抽样,样本很少完全遵循概率分布。样本中马踢死的人数大致服从泊松分布,所以我们可以合理地推断出总体服从泊松分布。
泊松分布的其他例子
自Bortkiewicz时代以来,泊松分布已经被用来描述许多其他事物。例如,泊松分布可以用来解释或预测:
- 每小时短信
- 每公顷公灰熊
- 每年都会发生机器故障
- 每月网站浏览量
- 每年流感个案
概率质量函数图
泊松分布可以直观地表示为概率质量函数的图形。概率质量函数是描述离散概率分布的函数。
最可能的事件数由分布的峰值表示模式。
- 当λ为非整数时,模态为最接近的小于λ的整数。
- 当λ为整数时,有两种模式:λ和λ−1。
当λ较低时,分布在其峰值的右侧比左侧长得多(即,它是强的右偏态).
随着λ的增加,分布看起来越来越类似于a正态分布。事实上,当λ大于或等于10时,正态分布是泊松分布的一个很好的近似。
泊松分布的均值和方差
泊松分布只有1参数,称为λ。
在大多数分布中,平均值用µ(mu)表示,方差用σ²(sigma²)表示。因为这两个参数在泊松分布中是相同的,我们使用λ符号来表示这两个参数。
泊松分布公式
泊松分布的概率质量函数为:
地点:
- 是服从泊松分布的随机变量吗
- 事件发生的次数是多少
- )是某一事件发生的概率k次
- 为欧拉常数(约为2.718)
- 一个事件发生的平均次数是多少
- !是阶乘函数
实践问题
泊松分布的常见问题
- 泊松分布公式中的e是什么意思?
-
的e在泊松分布公式代表数字2.718。这个数叫做欧拉常数。你可以简单地代入e当你在计算泊松概率时。欧拉常数是一个非常有用的数字,在微积分中尤其重要。
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。