对混淆矩阵中的假阳性和假阴性感到困惑?

数据挖掘 机器学习 深度学习
2022-03-12 16:42:32

我正在研究分类癌症 = 1 和无癌症 = 0 的二进制分类,我使用来自 sklearn 的混淆矩阵,这是我在测试集上的混淆矩阵:

 # confusion matrix
 [[18  0]
 [ 7 15]]

 # in my reading the order is:
   TN=18
   FP=0
   FN=7
   TP=15

但是在一些教程中,我看到 FP 和 FN 的顺序不同,有些说与我的阅读相同,请参见此处,但其他人说 FP 和 FN 的相反,请参见此处我的问题是在我的情况下哪一个是真的?请给我一个参考,以确保答案。

1个回答

在构建混淆矩阵时,请考虑测试集和预测集的顺序。这是我的一个代码中的一部分。

厘米 = 混淆矩阵(y_test,y_pred)

打印(厘米)

输出:
[[TN FP]

[FN TP]]

但是,如果我使用:

厘米 = 混淆矩阵(y_pred,y_test)

打印(厘米)

输出:
[[TN FN]

[FP TP]]

这是因为模型的预测现在以行而不是列的形式呈现混淆矩阵也可以是 NxN,或者类可能不会被标记为 0 或 1。您还可以更改 TN 和 TP 的位置,想想如果您将类命名为 9 和 10 会发生什么。换句话说,决策负面/正面迹象是我们的决定;我们说出它们是什么(希望以合理的方式)。

希望我能提供帮助,请不要犹豫,询问更多。问候。