概率分布|公式，类型和例子

发布于2022年6月9日肖恩·特尼．2022年11月10日修订。

一个概率分布是描述a的不同可能值的概率的数学函数吗变量．概率分布通常用图表或概率表来描述。

示例:概率分布

我们可以用概率表来描述一次抛硬币的概率分布:

结果	概率
头	尾巴
．5	．5

常见的概率分布包括二项分布、泊松分布，均匀分布。某些类型的概率分布用于假设检验，包括标准正态分布,F分布,学生的t分布．

什么是概率分布?

概率分布是理想化的频率分布．

一个频率分布描述特定的样本或数据集。它是一个变量的每个可能值在数据集中出现的次数。

一个值在样本中出现的次数由它决定概率的发生。Probability是一个介于0和1之间的数字，表示某事发生的可能性:

0表示不可能。
1表示确定。

一个值的概率越高，它在样本中的频率就越高。

更具体地说，一个值的概率是它在无限大样本中的相对频率。

无限大的样本在现实生活中是不可能的，所以概率分布是理论上的。它们是频率分布的理想化版本旨在描述人口样品是从。

概率分布用于描述现实生活中变量的总体，如抛硬币或鸡蛋的重量。它们也被用于假设检验来确定p值．

frequency_distribution_example_egg_weight — 示例:概率分布是理想化的频率分布

normal_distribution_example_egg_weight — 示例:概率分布是理想化的频率分布

遵循概率分布的变量被称为随机变量．你可以用特殊的符号来表示随机变量遵循特定的分布:

随机变量通常表示为X。
波浪号表示“遵循分布”。
分布用大写字母表示(通常是分布名称的第一个字母)，后面跟着包含分布的括号参数．

例如，下面的符号表示“随机变量”X服从正态分布，均值为μ和a方差的σ²．”

$X \sim N(\mu，\sigma^2)$

概率分布有两种类型:

离散概率分布
连续概率分布

离散概率分布

一个离散概率分布是a的概率分布吗分类变量或离散变量．

离散概率分布只包括可能值的概率。换句话说，离散概率分布不包括任何概率为零的值。例如，掷骰子的概率分布不包括2.5，因为它不是掷骰子的可能结果。

离散概率分布中所有可能值的概率加起来等于1。这是肯定的(即，概率为1)，一个观测值将有一个可能的值。

概率表

一个概率表表示a的离散概率分布分类变量．概率表也可以表示一个只有几个可能值的离散变量或一个连续变量按课间分组．

概率表由两列组成:

值或类间隔
他们的概率

示例:概率表

一个机器人用随机的问候语向人们打招呼。问候语的概率分布如下概率表所示:

问候	概率
“你好,人类!”	．6
“嗨!”	．1
“致敬，有机生命体。”	．2
“你好!”	．1

请注意，所有的概率都大于0，而且它们的和为1。

概率质量函数

一个概率质量函数(PMF)是一个数学函数，它描述了离散概率分布。它给出了一个变量的每个可能值的概率。

概率质量函数可以用方程或图形表示。

P(X = k) = \dfrac{e^{-\lambda} \lambda^k}{k!｝ — 示例:概率质量函数

常见的离散概率分布

分布	描述	例子
二项	描述具有两种可能结果的变量。这是成功次数的概率分布n试验与p成功的概率。	抛五次硬币朝上的次数
离散均匀	描述具有相等概率的事件。	随机抽的牌的花色
泊松	描述计数数据。它给出了事件发生的概率k次数:在给定的时间或空间间隔内的次数	每天收到的短信数量

以下是学生们喜欢Scribbr校对服务的原因

发现校对和编辑

连续概率分布

一个连续概率分布a的概率分布是连续变量．

连续变量的值可以在其最低值和最高值之间。因此，连续概率分布包括变量中的每一个数字范围．

连续变量具有特定值的概率非常小，以至于被认为概率为零。然而，一个值落在其范围内的某个值区间内的概率大于零。

概率密度函数

一个概率密度函数(PDF)是描述连续概率分布的数学函数。它提供概率密度一个变量的每一个值，它可以大于1。

概率密度函数可以用方程或图形表示。

在图形形式中，概率密度函数是一条曲线。通过计算曲线下的面积，可以确定某个值落在某个区间内的概率。您可以使用参考表或软件来计算面积。

整条曲线下的面积总是恰好为1，因为观测值肯定会落在变量的范围内(即概率为1)。

一个累积分布函数是另一种描述连续概率分布的函数。

f (x) = \ dfrac{1}{\σ\ sqrt{2 \π}}e ^{- \压裂{1}{2}\离开(\ dfrac {x - \μ}{\σ}\右)^ 2} — 示例:概率密度函数

常见的连续概率分布

分布	描述	例子
正态分布	描述具有值的数据，这些值离对象越远概率越小的意思是，为钟形概率密度函数。	SAT分数
连续均匀	描述具有相等概率的相等间隔的数据。	汽车等红灯的时间
对数正态分布	描述了右偏态数据。它是对数服从正态分布的随机变量的概率分布。	不同哺乳动物的平均体重
指数	描述小值比大值具有更高概率的数据。它是独立事件之间时间的概率分布。	两次地震间隔时间

如何求期望值和标准差

如果你有一个概率分布的公式、样本或概率表，你可以找到概率分布的期望值和标准差。

注意: 名义变量没有期望值或者标准偏差．

的期望值是另一个名字吗的意思是分布的。它通常被写成E（x)或µ。如果你对分布进行随机抽样，你应该期望样本的均值近似等于期望值。

如果你有公式描述分布，如概率密度函数，期望值通常由μ参数给出。如果没有µ参数，则可以从另一个参数中计算期望值参数使用特定于每个分布的方程。

如果你有样本，则样本均值为估计总体概率分布的期望值。样本量越大，估计就越准确。

如果你有概率表，您可以通过将每个可能的结果乘以其概率，然后将这些值相加来计算期望值。

示例:期望值

美洲知更鸟在巢里下2到4个蛋。假设这个概率表描述了每个巢中知更鸟蛋数量的概率分布:

鸡蛋	概率
2	0.2
3.	0．5
4	0.3

每窝知更鸟蛋的期望值是多少?

将每个可能的结果乘以它的概率:

鸡蛋(x）	概率(P（x）)	**x P***（x）
2	．2	2 * 0.2 = 0.4
3.	．5	3 * 0.5 = 1.5
4	．3.	4 * 0.3 = 1.2

对值求和:

E（x) = 0.4 + 1.5 + 1.2

E（x) = 3.1个鸡蛋

的标准偏差是对分布可变性的一种度量。它通常被写成σ。

如果你有公式描述分布，如概率密度函数，标准偏差有时由σ参数给出。如果没有σ参数，标准偏差通常可以使用特定于每个分布的公式从其他参数计算出来。

如果你有样本，样本的标准差是总体概率分布标准差的估计值。样本量越大，估计就越准确。

如果你有概率表，可以通过计算每个值与期望值之间的偏差，将其平方，乘以其概率，然后将值相加并取平方根来计算标准差。

示例:标准偏差

计算每个值与期望值之间的偏差:

鸡蛋(x）	概率(P（x）)	x–E（x）
2	．2	2−3.1 =−1.1
3.	．5	3−3.1 =−0.1
4	．3.	4−3.1 = 0.9

将值平方并乘以它们的概率:

鸡蛋(x）	概率(P（x）)	x–E（x）	［x–E（x）]²＊P（x）
2	．2	2−3.1 =−1.1	(−1.1)²* 0.2 = 0.242
3.	．5	3−3.1 =−0.1	(−0.1)2 * 0.5 = 0.005
4	．3.	4−3.1 = 0.9	(0.9)²* 0.3 = 0.243

将这些值相加并取平方根:

σ=√(0.242 + 0.005 + 0.243)

σ=√(0.49)

σ = 0.7个鸡蛋

如何用零分布检验假设

空分布重要的工具在里面吗假设检验．零分布是当检验的零假设为真时，检验统计量的概率分布。

所有假设检验都涉及a检验统计量．一些常见的例子有z，t，F，和卡方。测试统计量将样本总结为一个数字，然后将其与null分布进行比较以计算p价值．

的p值是获得一个等于或比样本检验统计量更极端的值的概率，假设零假设是真的。在实际应用中，它是指零分布的概率密度函数曲线下的面积等于或比样本的检验统计量更极端。

t_distribution_example_egg_weight — 示例:使用空分布检验假设

常见的空分布和使用它们的统计测试
分布	统计测试
标准正态（z分布)	单样本定位试验
学生的t分布	一个示例t测验两个示例t测验配对t测验线性回归皮尔森相关
F分布	方差分析嵌套线性模型的比较两方差相等
卡方	卡方拟合优度检验独立性卡方检验 McNemar检验法检验单方差检验