如何解释分类边界?

机器算法验证 机器学习 分类 神经网络 深度学习 反向传播
2022-04-18 15:25:38

我是神经网络和机器学习的初学者。我正在使用具有 1 个隐藏层的神经网络。我采用了螺旋数据集,并试图过度拟合数据。

我对它应用了神经网络,我得到了 98% 的准确率。但是,我在第二个图中得到了分类边界。我的意思是为什么我在黄色一侧读取颜色,在红色一侧读取蓝色!

我应该得到正确的数字边界。

在此处输入图像描述

即使我达到了高精度,我也没有得到这样的边界是否有原因。或者你能告诉我应该采取什么预防措施来避免这些问题。

1个回答

原因是您不是要求模型提供“所需的边界”,而只是要求模型正确分类您的数据

存在无限的决策边界,以相同的精度实现相同的分类任务。

当我们使用神经网络时,模型可以选择它想要的任何东西。此外,该模型不知道数据的形状(您的示例中的地面实况/生成模型/螺旋形状)。该模型将只选择一个“工作”决策边界,而不是“真正优化到真实分布”(如图 3 所示)

如果您想对决策边界做一些事情,请检查支持向量机事实上,即使你使用 SVM,决策边界也可能不是你所期望的,因为它会最大化“边距”,但仍然不知道真实分布(螺旋或其他形状)。


正如评论中提到的,不同类型的模型有不同的决策边界。例如,逻辑回归和线性判别分析(LDA)将有一条线(或高维空间中的超平面),而二次判别分析(QDA)将有一条二次曲线作为划分边界。

图片来源

在此处输入图像描述

最后,我对另一个问题的回答给出了一些关于不同模型决策边界的例子。

所有机器学习算法都线性分离数据吗?