抛硬币应该建模为 RJags 中的 Bernoulli 还是二项式抽奖?

机器算法验证 贝叶斯 二项分布 错误 伯努利分布 锯齿
2022-04-07 07:20:51

将硬币翻转建模为分层模型的最佳方法是什么?你说硬币抽奖是伯努利试验的一系列抽奖还是二项分布的抽奖?

那是这样的:

model {
  p ~ dunif( 0, 1 )
  for( i in 1 : n) {
    h[i] ~ dbern( p )
  }
}

或这个:

model {
  p ~ dunif( 0, 1 )
  numberOfHead ~ dbinom (totalTrials, p)
}
2个回答

通常从二项分布中抽取一次就足够了。但这取决于您拥有的数据。如果你有数据表明在单个硬币翻转中总共看到了多少个正面,那么二项分布就足够了,不需要 N 次伯努利翻转的详细模型。但是,如果您有关于单个硬币翻转结果的数据并且您需要区分它们(例如,因为单个硬币翻转的协变量),您将需要更详细的伯努利分布模型。

两种模型都会给出完全相同的结果。为什么?然原则RJags 是一个 R 包,它使用软件 JAGS 进行贝叶斯推理,任何完全贝叶斯过程,一个从后验分布进行推理的过程,都将满足似然原则。本质上,似然原理指出,如果两个似然函数彼此成比例,那么应该从这两个似然函数中获得关于参数的相同推断。

在您的示例中,我们从次独立投掷推断硬币正面朝上的概率在掷硬币之前,您假设在区间内的任何值都是等可能的。因此参数的先验分布是假设我们观察到次抛硬币,硬币正面朝上,在模型使用二项分布的情况下,似然函数为pnX1,...,Xnp[0,1]pπ(p)=1k0kn

l(p|X1,...,Xn)=(nk)pk(1p)nk

对于伯努利模型,似然函数是

l(p|X1,...,Xn)=pk(1p)nk

我们观察了数据,所以都是固定值,因此只是一个常数,而,记住的函数。一旦我们从 RJags 的后验分布中获得样本,我们将得出相同的结论,除了由于来自希望收敛的马尔可夫链的有限样本而导致的任何错误。nk(nk)l(p|X1,...,Xn)l(p|X1,...,Xn)llp

此外,如果您熟悉足够的统计量,您可能会注意到的充分统计量(假设固定)。 k=i=1nXipn