我有一个严重不平衡的数据集,存在分类问题。我尝试从sklearn.calibration包装中绘制校准曲线。具体来说,我尝试了以下模型:
rft = RandomForestClassifier(n_estimators=1000)
svc = SVC(probability = True, gamma = "auto")
gnb = MultinomialNB(alpha=0.5)
xgb = xgboost.XGBClassifier(n_estimators=1000, learning_rate=0.08, gamma=0, subsample=0.75, colsample_bytree=1, max_depth=7)
校准曲线如下
正如您在图中看到的,随机森林和 XGBoost 接近完美校准的模型。然而,朴素贝叶斯和 SVM 的表现非常糟糕。
我如何解释/描述这两个模型的行为?
