贝叶斯重要性抽样作为对瓦瑟曼“悖论”的回答

机器算法验证 贝叶斯 数理统计 重要性抽样
2022-04-17 03:34:52

在他的书和他的博客中,拉里·瓦瑟曼(Larry Wasserman)都讨论了一个例子,其中贝叶斯方法的天真应用给出了荒谬的答案。

介绍

问题是估计归一化c非归一化概率分布的:g(x). 目标值c是(谁)给的:

c=g(x)

公关。Wasserman 表明,朴素贝叶斯估计c给出愚蠢的结果。我让你看看他的博客。他提出了一个悬而未决的问题,即构造 c 的贝叶斯估计量

之前在 SE 上讨论过这个问题,答案主要是这是一个愚蠢的例子,没有理由对这个问题进行贝叶斯推理。但无论如何,让我尝试一下:

采样解决方案

要构建贝叶斯估计器,我们首先看看有哪些常规方法可用。一种估计方法c是拒绝抽样:我们从第二个简单的概率分布中生成样本q(x). 注意到这些样本xk,然后我们计算比率的经验平均值:g(x)q(x)并获得一个无偏估计c

c^=1nk=1ng(xk)q(xk)

贝叶斯重要性抽样 ?

现在,这可能是愚蠢的,但为什么我们不能,至少在理论上,构造一个贝叶斯估计器,将序列作为数据g(xk)q(xk)并试图建立一个后验c给定那些?

例如,如果我们碰巧在一个我们知道比率的情况下g(x)q(x)是有界的,我们可以将观察结果建模为 beta 分布的结果,并进行共轭推理。如果我们没有上限,我们可以将观察结果建模为 Gamma。我们甚至可以使用具有非共轭先验和/或复杂先验的可能性。

我的问题是:

  1. 这种进行贝叶斯重要性采样的想法是否已经分析过?

  2. 这是否出于某种原因无法解决推断归一化常数的问题?

1个回答

积分和微分方程的数值分辨率存在贝叶斯方法:它被称为概率数值。在之前引入高斯过程g导致后验概率g本身和积分取决于g一次观察g(x1),,g(xp)已经做出来了。

Philipp Hennig 和 Michael Osborne 针对这种方法创建了一个网页,您可以在其中找到参考资料和链接。