机器算法验证 - 如何选择拒绝抽样的常数 - 吾爱随笔录

如何选择拒绝抽样的常数

机器算法验证蒙特卡洛拒绝抽样

2022-04-18 04:14:44

当使用非马尔可夫蒙特卡罗抽样方法时，例如接受-拒绝抽样，我们选择一个密度 $\ h(x)$ 和一个已知常数 $\ c$ 这样 $\ ch(x)$ 充当我们目标分布的覆盖函数 $\pi(x)$ .

由于我们只能访问未知归一化常数的目标分布，因此我们并不真正知道归一化目标分布是什么样的。那么如何定义一个覆盖所有值的覆盖函数呢？到目前为止，我看到的唯一例子是基本模拟，其中的分析形式 $\pi(x)$ 已经知道了。

3个回答

让 $\pi(x) = M f(x)$ ，在哪里 $M$ 是归一化常数。在很多情况下，只有 $f(x)$ 已知并且 $M$ 是未知的。

要实施拒绝抽样，您需要 $c$ 这样，对于所有人 $x$ ,

\frac{π (x)}{h (x)} \leq c .

$\dfrac{\pi(x)}{h(x)} \leq c.$

那么对于所有人 $x$ ,

\frac{f (x)}{h (x)} \leq \frac{c}{M} := c^{'} .

$\dfrac{f(x)}{h(x)} \leq \dfrac{c}{M} := c'.$

你不知道 $c$ 或者 $M$ ，但你应该能够找到 $c'$ , 如果你可以玩 $f/h$ . （对于更高维度的分布，这更难做到）

算法接受时 $\pi(x)/ch(x)$ 大于来自均匀随机变量的实现，这与 $f(x)/c'h(x)$ 大于实现。因此，该算法可以实现，即使 $M$ 不知道。

举个例子，考虑密度与 $e^{-(1+x^4)^\frac14},\quad-\infty<x<\infty \,.$

我目前不知道该密度的归一化常数是多少。（嗯，我可以说它不会离 1 太远，所以我有一些概念，但是能够在一个数量级内猜测它并没有多大帮助）

不难看出 $(1+x^4)^\frac14 > x$ 为了 $x\geq 0$ （如果不明显，看两边的四次方，从中肯定是清楚的），所以通过对称性 $(1+x^4)^\frac14 > |x|$ 无处不在，因此很明显 $e^{-|x|}>e^{-(1+x^4)^\frac14}$ 在实线上。

因此，我可以使用放大 2 倍的标准拉普拉斯分布作为主要函数。（有一些更有效的选择，但使用这个简单的情况就足够了。请注意，我们现在确定未缩放密度的积分必须小于 2。）

我仍然不太清楚有问题的密度集成到什么程度，但我可以从中模拟。

事实上，这是一个（刚刚超过）一百万个值的直方图：

（并且刚刚运行代码来模拟这些值，我现在知道归一化常数是什么，因为您可以从接受率中得出一个近似值。未缩放密度的积分约为 1.397 - 用R中的积分函数，它给出1.396785，绝对误差<0.00011——所以归一化常数大约是它的倒数。）

更一般的选择原则 $M$ 是

inf_{θ \in Θ} sup_{x \in R} \frac{f (x)}{g_{θ} (x)}

$\inf_{\theta\in\Theta}\sup_{x\in\mathbb{R}}\frac{f(x)}{g_\theta(x)}$

其中是归一化目标，是提议密度。 $f$ $g_\theta$

例如，对于和 $f(x)=(2\pi)^{-\frac{1}{2}}e^{-x^2/2}$ $g(x)=\theta^{-1}e^{-\theta |x|}$

我们将有和 $\sup_xf(x)/g_\theta(x)=\theta(2\pi)^{-\frac{1}{2}}e^{-\theta^2/2}$ $\inf_\theta\theta(2\pi)^{-\frac{1}{2}}e^{-\theta^2/2}=(2\pi)^{-\frac{1}{2}}e^{-\frac{1}{2}}$

但是，如果您的目标未标准化，那么您只能靠运气尝试。（如果我错了请纠正我）

其它你可能感兴趣的问题

上一篇如果中位数相等，如何解释 Mann-Whitney 的统计显着性？下一篇标准 beta 和非标准 beta 分布之间的区别？