概率分布|公式,类型和例子

一个概率分布是描述a的不同可能值的概率的数学函数吗变量.概率分布通常用图表或概率表来描述。

示例:概率分布
我们可以用概率表来描述一次抛硬币的概率分布:

结果 概率
尾巴
.5 .5

常见的概率分布包括二项分布、泊松分布,均匀分布。某些类型的概率分布用于假设检验,包括标准正态分布,F分布,学生的t分布

什么是概率分布?

概率分布是理想化的频率分布

一个频率分布描述特定的样本或数据集。它是一个变量的每个可能值在数据集中出现的次数。

一个值在样本中出现的次数由它决定概率的发生。Probability是一个介于0和1之间的数字,表示某事发生的可能性:

  • 0表示不可能。
  • 1表示确定。

一个值的概率越高,它在样本中的频率就越高。

更具体地说,一个值的概率是它在无限大样本中的相对频率。

无限大的样本在现实生活中是不可能的,所以概率分布是理论上的。它们是频率分布的理想化版本旨在描述人口样品是从。

概率分布用于描述现实生活中变量的总体,如抛硬币或鸡蛋的重量。它们也被用于假设检验来确定p

示例:概率分布是理想化的频率分布
假设一个鸡蛋农想知道她农场里的鸡蛋是某一尺寸的概率。

农民随机称重100个鸡蛋,用直方图描述它们的频率分布:

frequency_distribution_example_egg_weight

她可以从这个频率分布直接得到不同鸡蛋大小概率的大致概念。例如,她可以看到一个鸡蛋大概率在1.9盎司左右,而一个鸡蛋大概率在2.1盎司以上。

假设农民想要更精确的概率估计。一种选择是通过称量更多的鸡蛋来提高她的估计。

一个更好的选择是认识到鸡蛋的大小似乎遵循一个常见的概率分布,称为正态分布.农民可以通过假设鸡蛋的重量是正态分布来做出一个理想化的鸡蛋重量分布:

normal_distribution_example_egg_weight

由于统计学家很好地理解了正态分布,因此即使样本量相对较小,农民也可以计算出精确的概率估计值。

遵循概率分布的变量被称为随机变量.你可以用特殊的符号来表示随机变量遵循特定的分布:

  • 随机变量通常表示为X。
  • 波浪号表示“遵循分布”。
  • 分布用大写字母表示(通常是分布名称的第一个字母),后面跟着包含分布的括号参数

例如,下面的符号表示“随机变量”X服从正态分布,均值为μ和a方差的σ2.”

X \sim N(\mu,\sigma^2)

概率分布有两种类型:

离散概率分布

一个离散概率分布是a的概率分布吗分类变量或离散变量

离散概率分布只包括可能值的概率。换句话说,离散概率分布不包括任何概率为零的值。例如,掷骰子的概率分布不包括2.5,因为它不是掷骰子的可能结果。

离散概率分布中所有可能值的概率加起来等于1。这是肯定的(即,概率为1),一个观测值将有一个可能的值。

概率表

一个概率表表示a的离散概率分布分类变量.概率表也可以表示一个只有几个可能值的离散变量或一个连续变量按课间分组

概率表由两列组成:

  • 值或类间隔
  • 他们的概率
示例:概率表
一个机器人用随机的问候语向人们打招呼。问候语的概率分布如下概率表所示:

问候 概率
“你好,人类!” .6
“嗨!” .1
“致敬,有机生命体。” .2
“你好!” .1

请注意,所有的概率都大于0,而且它们的和为1。

概率质量函数

一个概率质量函数(PMF)是一个数学函数,它描述了离散概率分布。它给出了一个变量的每个可能值的概率。

概率质量函数可以用方程或图形表示。

示例:概率质量函数
想象一下,在美国,每人拥有的毛衣数量是泊松分布

分布的概率质量函数由公式给出:

P(X = k) = \dfrac{e^{-\lambda} \lambda^k}{k!}

地点:

  • P(X = k) 一个人拥有的概率是准确的吗k 毛衣
  • \λ 是平均每人毛衣的数量(\lambda = 3 ,在这种情况下)
  • e 为欧拉常数(约为2.718)

这个概率质量函数也可以用图表表示:

probability_example_egg_weight

注意,变量只能有特定的值,这些值由封闭的圆表示。你可以有两件或十件毛衣,但你不能有3.8件毛衣。

一个人拥有0件毛衣的概率是。05,拥有1件毛衣的概率是。15,以此类推。如果你把每个人可能拥有的毛衣数量的所有概率加在一起,结果正好等于1。

常见的离散概率分布

分布 描述 例子
二项 描述具有两种可能结果的变量。这是成功次数的概率分布n试验与p成功的概率。 抛五次硬币朝上的次数
离散均匀 描述具有相等概率的事件。 随机抽的牌的花色
泊松 描述计数数据。它给出了事件发生的概率k次数:在给定的时间或空间间隔内的次数 每天收到的短信数量

以下是学生们喜欢Scribbr校对服务的原因

发现校对和编辑

连续概率分布

一个连续概率分布a的概率分布是连续变量

连续变量的值可以在其最低值和最高值之间。因此,连续概率分布包括变量中的每一个数字范围

连续变量具有特定值的概率非常小,以至于被认为概率为零。然而,一个值落在其范围内的某个值区间内的概率大于零。

概率密度函数

一个概率密度函数(PDF)是描述连续概率分布的数学函数。它提供概率密度一个变量的每一个值,它可以大于1。

概率密度函数可以用方程或图形表示。

在图形形式中,概率密度函数是一条曲线。通过计算曲线下的面积,可以确定某个值落在某个区间内的概率。您可以使用参考表或软件来计算面积。

整条曲线下的面积总是恰好为1,因为观测值肯定会落在变量的范围内(即概率为1)。

一个累积分布函数是另一种描述连续概率分布的函数。

示例:概率密度函数
蛋重正态分布的概率密度函数由公式给出:

f (x) = \ dfrac{1}{\σ\ sqrt{2 \π}}e ^{- \压裂{1}{2}\离开(\ dfrac {x - \μ}{\σ}\右)^ 2}

地点:

  • f (x) 蛋重的概率密度是多少
  • \μ 的意思是种群的蛋重(\mu = 1.85 奥兹,在这种情况下)
  • \σ 标准偏差的卵重(\sigma = 0.13 奥兹,在这种情况下)

    一个鸡蛋正好是2盎司的概率是零。虽然一个鸡蛋的重量可以非常接近2盎司,但它的重量恰好是2盎司是极其不可能的。即使一个普通的秤测量一个鸡蛋的重量是2盎司,一个无限精确的秤也会发现鸡蛋的重量和2盎司之间有微小的差异。

    鸡蛋在一定重量区间内(如1.98和2.04 oz.)的概率大于零,可以在概率密度函数图中表示为阴影区域:

    shaded_area_example

    阴影区域的面积为0.09,这意味着一个鸡蛋的重量在1.98到2.04盎司之间的概率为0.09。这个面积是用统计软件计算出来的。

    常见的连续概率分布

    分布 描述 例子
    正态分布 描述具有值的数据,这些值离对象越远概率越小的意思是,为钟形概率密度函数。 SAT分数
    连续均匀 描述具有相等概率的相等间隔的数据。 汽车等红灯的时间
    对数正态分布 描述了右偏态数据。它是对数服从正态分布的随机变量的概率分布。 不同哺乳动物的平均体重
    指数 描述小值比大值具有更高概率的数据。它是独立事件之间时间的概率分布。 两次地震间隔时间

    如何求期望值和标准差

    如果你有一个概率分布的公式、样本或概率表,你可以找到概率分布的期望值和标准差。

    注意: 名义变量 没有期望值或者 标准偏差

    期望值是另一个名字吗的意思是分布的。它通常被写成Ex)或µ。如果你对分布进行随机抽样,你应该期望样本的均值近似等于期望值。

    • 如果你有公式描述分布,如概率密度函数,期望值通常由μ参数给出。如果没有µ参数,则可以从另一个参数中计算期望值参数使用特定于每个分布的方程。
    • 如果你有样本,则样本均值为估计总体概率分布的期望值。样本量越大,估计就越准确。
    • 如果你有概率表,您可以通过将每个可能的结果乘以其概率,然后将这些值相加来计算期望值。
    示例:期望值
    美洲知更鸟在巢里下2到4个蛋。假设这个概率表描述了每个巢中知更鸟蛋数量的概率分布:

    鸡蛋 概率
    2 0.2
    3. 0.5
    4 0.3

    每窝知更鸟蛋的期望值是多少?

    将每个可能的结果乘以它的概率:

    鸡蛋(x 概率(Px)) x * Px
    2 .2 2 * 0.2 = 0.4
    3. .5 3 * 0.5 = 1.5
    4 .3. 4 * 0.3 = 1.2

    对值求和:

    Ex) = 0.4 + 1.5 + 1.2

    Ex) = 3.1个鸡蛋

    标准偏差是对分布可变性的一种度量。它通常被写成σ。

    • 如果你有公式描述分布,如概率密度函数,标准偏差有时由σ参数给出。如果没有σ参数,标准偏差通常可以使用特定于每个分布的公式从其他参数计算出来。
    • 如果你有样本,样本的标准差是总体概率分布标准差的估计值。样本量越大,估计就越准确。
    • 如果你有概率表,可以通过计算每个值与期望值之间的偏差,将其平方,乘以其概率,然后将值相加并取平方根来计算标准差。
    示例:标准偏差
    计算每个值与期望值之间的偏差:

    鸡蛋(x 概率(Px)) xEx
    2 .2 2−3.1 =−1.1
    3. .5 3−3.1 =−0.1
    4 .3. 4−3.1 = 0.9

    将值平方并乘以它们的概率:

    鸡蛋(x 概率(Px)) xEx xEx)]2Px
    2 .2 2−3.1 =−1.1 (−1.1)2* 0.2 = 0.242
    3. .5 3−3.1 =−0.1 (−0.1)2 * 0.5 = 0.005
    4 .3. 4−3.1 = 0.9 (0.9)2* 0.3 = 0.243

    将这些值相加并取平方根:

    σ=(0.242 + 0.005 + 0.243)

    σ=(0.49)

    σ = 0.7个鸡蛋

    如何用零分布检验假设

    空分布重要的工具在里面吗假设检验.零分布是当检验的零假设为真时,检验统计量的概率分布。

    所有假设检验都涉及a检验统计量.一些常见的例子有ztF,和卡方。测试统计量将样本总结为一个数字,然后将其与null分布进行比较以计算p价值

    p值是获得一个等于或比样本检验统计量更极端的值的概率,假设零假设是真的。在实际应用中,它是指零分布的概率密度函数曲线下的面积等于或比样本的检验统计量更极端。

    示例:使用空分布检验假设
    一个一个示例t测验是一个假设检验,它使用了一个叫做Student 'st.如果一个样本有t对于1.7,我们计算p值(对于单侧测试)作为右侧的阴影区域t在Student 's的零分布中= 1.7t

    t_distribution_example_egg_weight

    这个面积可以用微积分、统计软件或参考表格来计算,等于0.06。因此,p= .06。

    常见的空分布和使用它们的统计测试
    分布 统计测试
    标准正态z分布) 单样本定位试验
    学生的t分布 一个示例t测验

    两个示例t测验

    配对t测验

    线性回归

    皮尔森相关

    F分布 方差分析

    嵌套线性模型的比较

    两方差相等

    卡方 卡方拟合优度检验

    独立性卡方检验

    McNemar检验法检验

    单方差检验

    概率分布公式

    一般概率分布的概率质量函数和概率密度函数
    分布 公式 公式类型
    二项 Picture11 概率质量函数
    离散均匀 Picture10 概率质量函数
    泊松 Picture9 概率质量函数
    正常的 Picture8 概率密度函数
    连续均匀 Picture6 概率密度函数
    指数 Picture7 概率密度函数

    概率分布的常见问题

    相对频率和概率之间的区别是什么?

    概率是相对频率经过无数次的试验。

    例如,一枚硬币正面朝上的概率是。5,这意味着如果你将硬币投掷无限次,它有一半的概率是正面朝上的。

    因为做一件事无限次是不可能的,所以相对频率常被用来估计概率。如果你抛一枚硬币1000次,得到507个正面,相对频率。507是一个很好的概率估计。

    什么是正态分布?

    在一个正态分布,数据对称分布,无歪斜。大多数值都聚集在一个中心区域周围,当值离中心越远时,值就越小。

    集中趋势的度量(均值、众数和中位数)在正态分布中完全相同。

    正态分布

    这两种概率分布是什么?

    概率分布属于两大类:离散概率分布而且连续概率分布.在每个类别中,都有许多类型的概率分布。

    引用这篇Scribbr文章

    如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

    特尼,S.(2022年11月10日)。概率分布|公式,类型和例子。Scribbr。检索于2022年12月15日,来自//www.charpingshvac.com/statistics/probability-distributions/

    这篇文章有用吗?
    肖恩·特尼

    在他的硕士和博士期间,Shaun学习了如何将科学和统计方法应用到他的生态学研究中。现在,他喜欢教学生如何为他们自己的论文和研究项目收集和分析数据。
    Baidu