alpha 和/或 beta 小于 1 的 Beta 分布的直觉是什么?

机器算法验证 贝叶斯 直觉 贝塔分布 杰弗里斯之前
2022-03-23 12:39:07

我对自己很好奇,但也试图向别人解释这一点。

beta 分布通常用作二项似然的贝叶斯共轭先验。经常用例子来解释类似于成功的次数,而类似于失败的次数。(α1)(β1)


正如预期的那样,β 分布与等价于均匀分布。α=β=1

但是 beta 分布的值可以小于 1(任何非负数)。在极端情况下,会产生一个双峰 PDF(概率密度函数),其值仅为 0 和 1。我仍然可以直观地理解这一点:它代表了抛硬币的情况——而不是正面或正面的概率尾部,而是结果:只有 2 种可能性,0 或 1(或正面或反面)。α=β=0


但是任何值我都找不到解释或思考的好方法。我可以计算它,但不能真正理解它。αβ


对于任何可以帮助解释共轭先验在我看来它不应该提供任何信息的人的奖励积分,这将是一个带有的 beta 分布,以及实际用作没有的先验信息,杰弗里的先验,它使用α=β=1α=β=0.5

附录

看来我需要更清楚了。我希望从概念上理解的 beta 分布可能代表什么自然现象α=β=12

例如,

  • n=10 和 k=4 “均值”的二项分布:具有双峰响应的某些现象在 10 次尝试中经历了 4 次“成功”。
  • k=2 和的泊松分布意味着:“通常”每小时发生 4.5 次(或任何时间单位)的某些现象在间隔内仅发生两次。λ=4.5

或者即使是正整数 beta 分布,我也可以说:

  • 的Beta 分布意味着:某些具有双峰响应的现象在 9 次尝试中成功 3 次,失败 6 次。 α=4β=7
    • (我知道这个有点不准确,因为 beta 分布是连续的并且提供概率密度而不是mass,但这通常是从概念上看待或解释它的方式,以及为什么它被用作先验共轭。)

为 beta 分布创建什么样的类似结构或含义α=β=12


我不是在寻找情节。正如我之前所说,我知道如何在数学上使用 beta 分布(绘制、计算等)我只是想获得一些自然的直觉。

3个回答

这是一个简单的例子,可能有一些直观的价值。

在美国职业棒球大联盟中,每支球队每赛季打 162 场比赛。假设一支球队赢得或输掉每场比赛的可能性相同。这样一支球队的胜负多于多少比例?(为了具有对称性,如果一支球队的输赢在任何时候都打成平手,我们说如果在打平之前它领先,我们就说它领先,否则就落后了。)

假设我们随着赛季的进行查看球队的输赢记录。对于我们的球队来说,输赢就像掷硬币决定的,你可能会认为一支球队很可能在整个赛季中领先大约一半的时间。实际上,一半的时间是最不可能领先的时间。

下面的“浴缸形”柱状图显示了这样一支球队在一个赛季中领先的时间比例的大致分布。曲线是直方图基于一个团队的 20,000 个模拟 162 场比赛的赛季,其中胜利和失败就像独立掷硬币一样,在 R 中模拟如下:Beta(.5,.5).

set.seed(1212);  m = 20000;  n = 162;  prop.ahead = numeric(m)
for (i in 1:m)
 {
 x = sample(c(-1,1), n, repl=T);  cum = cumsum(x)
 ahead = (c(0, cum) + c(cum,0))[1:n]  # Adjustment for ties
 prop.ahead[i] = mean(ahead >= 0)
 }

cut=seq(0, 1, by=.1); hdr="Proportion of 162-Game Season when Team Leads"  
hist(prop.ahead, breaks=cut, prob=T, col="skyblue2", xlab="Proportion", main=hdr)
curve(dbeta(x, .5, .5), add=T, col="blue", lwd=2)

在此处输入图像描述

注意: Feller (Vol. 1) 讨论了这样一个过程。的 CDF是反正弦函数的常数倍数,因此 Feller 称其为“反正弦定律”。Beta(.5,.5)

BruceET 的回答确实帮助我更好地理解了这一点。

我突然想到,这种“浴缸形状”是由于任何具有保存状态的随机过程造成的

所以我想写一个快速的答案,可以帮助像我这样理解数学并且不是新手,但喜欢找到展示自然现象的案例的其他人。

  • ,情况表示随机掷硬币并保存状态一些例子: α=0.5β=0.5
    • 投注时的总赢或输(假设 50%/50% 的赔率和恒定的投注规模)
    • 运动队记录像布鲁斯的例子
    • 今年总降雨量将比去年更多的可能性(这不是 50%/50% 并且有很多外部因素,但它确实捕捉到了对获得 Jeffrey 的“马蹄形”至关重要的“总降雨量”先验生成。

非常感谢,布鲁斯!

如果以为例,则 pdf 看起来像马蹄铁,在区间附近密度低因此,作为先验,它在极端情况下增加了很多密度,这有助于后部具有相似的形状。α=β=0.5(0,1)0.5

我将其理解为一种帮助后部从移动的设备,如果您尝试做出二元决定,这可能会有所帮助。 50%01