我有一个大约 4.7K 的数据集,专注于二进制分类。班级比例为 33:67。这意味着标签 1 是 1558 (33%),标签 0 是我数据集的 3154 (67%)。
我的数据集不平衡吗?有人说还不错
我的目标只是增加 F1 分数。我class_weight=balanced在我的参数和scoring=f1CV 期间设置,如下所示。
svm=SVC(random_state=42)
svm_cv=GridSearchCV(svm,param_grid,cv=5,scoring='f1')
svm_cv.fit(X_train_std,y_train)
你能通过代码示例告诉我如何增加少数类的权重吗?balanced如果这与选择参数有什么不同
目前我的结果如下
我了解少数算法的 AUC 高于 80,但我相信 F1 分数对于像我这样的不平衡类问题更重要。
你能帮我吗?我尝试过采样少数类但没有太大改善。
增加功能不会让我达到 80% 的 F1 分数
