分类器阈值接近 0 有意义吗?

数据挖掘 机器学习 准确性 奥克
2022-02-19 20:50:46

我的 roc 曲线的 AUC 为 0.91。我应用了以下函数来确定最佳阈值:threshold1[np.argmin(np.abs(false_positive_rate1+true_positive_rate1-1))]我得到了 0.004。是否有意义?这意味着类之间的变化非常温和,它们之间没有足够的差异?

1个回答

没关系。

根据错误分类的成本,您可能会选择更低的阈值零。毕竟,我们中的许多人只是在过去两年里假设每个人都感染了 Covid-19,因为假阴性的代价可能是灾难性的。

截止阈值受错误分类成本影响的想法导致通过适当的评分规则直接分析机器学习概率输出。我将提供一些关于这个主题的常用链接。

https://www.fharrell.com/post/class-damage/ https://www.fharrell.com/post/classification/ https://stats.stackexchange.com/a/359936/247274 https://stats .stackexchange.com/questions/464636/

对于它的价值,我链接的博客 Frank Harrell对 ROC 曲线的看法相当低,并主张根据错误分类成本(可能因主题而异)而不是基于 ROC 曲线来选择阈值.