我目前正在使用一个看起来很容易分离的数据集,并且 SVM 的准确度为 99%(NN-98%、RF-98%、DT-96-97%,并且我检查了泄漏和过度拟合)。作为我项目的一部分,我还在学习如何实现一个混合模型,但它的准确率也是 99%(1 条记录错误分类)。它似乎错误地将同一记录分类为 SVM,并且似乎没有其他算法可以使该记录正确。Probability wise-RF 和 Logistic Regression 给出的概率为 0.5-0.7,但所有其他模型给出错误预测的概率为 0.9-1。我在想我现在应该怎么做。我是否可以使用某些技术将堆叠模型中的概率降低到 0.5 以下 t 分类它目前的方式?我正在使用 StackingCVClassifier 来实现,这是一个二进制分类项目。
我目前使用 SVM、LR、RF 作为基本模型,NB 作为元模型。
我的另一个问题是,如果准确性与 SVM 相同,那么制作混合模型是否有价值?
谢谢!