带概率的离散序数分类

数据挖掘 机器学习 xgboost
2022-03-02 22:53:34

如果我有 1、2、3 和 4 类。但是,我还需要其他每个类的概率。我目前正在使用 XGBoost 进行一对一分类,但这意味着我们正在丢失信息,因为这些类是有序的。

2个回答

Probit 和 logit 序数回归模型的累积概率P(yi|x). 所以你应该能够通过取差来获得类概率P(y=i|x)=P(yi|x)P(yi1|x). 然后,它是否使您可以使用概率仅取决于实现。

R例如,您可以从包中获取这些概率polr

[即使您在进行一对一分类时丢失了一些信息,序数回归模型也会做出一些比例假设(如果不适合您的数据)可能不一定会给您更好的结果。]

我认为为了获得每个类的概率,您应该进行多类分类,而不是一对一分类。在 one-vs-rest 分类中,其余类别组合在一起作为一个类别,因此不可能分别获得每个类别的概率。