机器算法验证 - 抛硬币应该建模为 RJags 中的 Bernoulli 还是二项式抽奖？ - 吾爱随笔录

抛硬币应该建模为 RJags 中的 Bernoulli 还是二项式抽奖？

机器算法验证贝叶斯二项分布错误伯努利分布锯齿

2022-04-07 07:20:51

将硬币翻转建模为分层模型的最佳方法是什么？你说硬币抽奖是伯努利试验的一系列抽奖还是二项分布的抽奖？

那是这样的：

model {
  p ~ dunif( 0, 1 )
  for( i in 1 : n) {
    h[i] ~ dbern( p )
  }
}

或这个：

model {
  p ~ dunif( 0, 1 )
  numberOfHead ~ dbinom (totalTrials, p)
}

2个回答

通常从二项分布中抽取一次就足够了。但这取决于您拥有的数据。如果你有数据表明在单个硬币翻转中总共看到了多少个正面，那么二项分布就足够了，不需要 N 次伯努利翻转的详细模型。但是，如果您有关于单个硬币翻转结果的数据并且您需要区分它们（例如，因为单个硬币翻转的协变量），您将需要更详细的伯努利分布模型。

两种模型都会给出完全相同的结果。为什么？似然原则。RJags 是一个 R 包，它使用软件 JAGS 进行贝叶斯推理，任何完全贝叶斯过程，一个从后验分布进行推理的过程，都将满足似然原则。本质上，似然原理指出，如果两个似然函数彼此成比例，那么应该从这两个似然函数中获得关于参数的相同推断。

在您的示例中，我们从次独立投掷推断硬币正面朝上的概率。在掷硬币之前，您假设在区间内的任何值都是等可能的。因此参数的先验分布是。假设我们观察到次抛硬币，硬币正面朝上，。在模型使用二项分布的情况下，似然函数为 $p$ $n$ $X_1,...,X_n$ $p$ $[0,1]$ $p$ $\pi (p)=1$ $k$ $0\leq k\leq n$

l (p | X_{1}, . . ., X_{n}) = (\binom{n}{k}) p^{k} (1 - p)^{n - k}

$l(p|X_1,...,X_n)= {n \choose k}p^k (1-p)^{n-k}$

对于伯努利模型，似然函数是

l_{⋆} (p | X_{1}, . . ., X_{n}) = p^{k} (1 - p)^{n - k}

$l_\star (p|X_1,...,X_n)=p^k(1-p)^{n-k}$

我们观察了数据，所以和都是固定值，因此只是一个常数，而，记住和是的函数。一旦我们从 RJags 的后验分布中获得样本，我们将得出相同的结论，除了由于来自希望收敛的马尔可夫链的有限样本而导致的任何错误。 $n$ $k$ ${n \choose k}$ $l(p|X_1,...,X_n) \propto l_\star(p|X_1,...,X_n)$ $l$ $l_\star$ $p$

此外，如果您熟悉足够的统计量，您可能会注意到的充分统计量（假设固定）。 $k=\sum_{i=1}^n{X_i}$ $p$ $n$

其它你可能感兴趣的问题

上一篇具有大量但有限的可能值的计数变量是分类变量还是连续变量？下一篇如何验证我的多元线性回归模型？