有很多关于 0/1 数据的贝叶斯(beta-binomial)多臂老虎机的资料,但我想稍微扩展一下。
为了提供一些背景信息,假设我有两个网页,A 和 B。现在我想测试哪个网页可以吸引更多的人来电,所以我开始随机向来访者提供 A、B。
这等效于从 A、B 上的相同 beta 先验开始 - 要么 aka uninformed 要么一些两者。
随着二进制数据的到来(人们打电话或不打电话),我根据贝叶斯规则更新,所以我最终得到和 B 类似。
这里的试验是我为访问者提供一个网页,而成功是一个电话,要清楚。
我的问题
这种二进制数据模型的连续模拟是什么?也就是说,如果我现在输入的数据是等形式,我可以使用什么来优化 A 或 B 哪个更好?我已经研究了一点高斯过程,但我不确定这是我想要的。谢谢你的帮助。
可以在此处找到此问题的扩展。