混淆矩阵与 AUC 与随机森林混淆
数据挖掘
机器学习
随机森林
混淆矩阵
2022-03-03 04:04:18
1个回答
从您的混淆矩阵来看,您的班级不平衡实际上看起来过于偏爱正面班级(90.04% 到 9.96%)。因为您的数据中存在如此极端的类别不平衡,所以您的随机森林可能只是将几乎所有内容都归类为正类并称其为一天。
要解决此问题,您需要对较大的类进行下采样或对较小的类进行上采样以接近 50/50 分割。否则,您可能最终会得到一个严重高估正类的分类器。
当您拆分数据时,您还可以尝试按标签进行分层(以便在您的训练和测试集中存在相同比例的正负类)。
