在贝叶斯逻辑回归中包括输出类的特征依赖先验

机器算法验证 物流 贝叶斯 预测模型 事先的 后部
2022-03-31 23:14:03

使用数据进行逻辑回归时DN={(xi,yi)}iNxiXN(每个数据点有 N 个特征)和yiY被分配输出类,在贝叶斯框架中,我们将先验分布分配给模型参数θ, 计算后验

p(θ|DN)p(θ)L(y|x,θ)

然后从后面采样θ生成对输出类的预测y新的观察x给定基于数据训练的模型DN使用后验预测分布

p(y|x,DN)=p(y|x,θ)p(θ|DN)dθ.

我想知道如何在输出类中加入先验信念y给定x影响预测分布。

到目前为止,我们只讨论在模型参数上设置先验。但我更经常可以使用数据特征和输出类之间的相关性(例如,我关于人的输入数据x有一个特征“学术学位”,我对输出类“富裕”与“无家可归”有先验)。

我知道这些先验取决于我的数据特征,所以我要么必须选择一些,要么平均它们。但总的来说,我缺乏这个词p(y|x)独立于模型参数θ.

包含这个的正确贝叶斯方法是什么?

到目前为止,我已经看到了一些包含输出类的先验信息的方法:

1)进入监督学习中训练算法的超参数。这主要是通过引入关于类的整体频率的先验知识,进行某种上采样或样本加权以解决类不平衡的方式。

2)导入模型的参数。我不太确定这是如何完成的,但我怀疑先前的预测分布已经过校准,使其类似于观察数据之前类的预期输出。这显然类似于经验贝叶斯方法:将我们先前关于数据的证据转换为参数先验,以使先验预测分布类似于我们的信念。

然而,这些都是间接的方式。必须有替代方法,将先前先验概率分布/分数的分数包含到分类器的输出中。

0个回答
没有发现任何回复~