随机森林和神经网络的类似输出

数据挖掘 神经网络 随机森林
2022-02-18 18:25:18

我使用训练数据集来训练随机森林和神经网络(一个隐藏层)。然后我比较了两个系统在测试数据集上的表现。有趣的是,结果证明两者的预测概率大致相同。森林将 86% 的数据正确分类为 0 或 1 类,网络达到 85%。由于 0 类中有 75% 的数据,我对结果不太满意,希望有更好的结果。

然后我分析了哪些数据集分类错误。事实证明,存在很大的重叠:86% 的数据被森林分类错误,也被网络错误分类。然后我比较了森林和网络归因于这些测试样本的概率。此外,概率几乎总是具有可比性,因此当森林确定样本A属于类别 0 时,网络也确定 0 是正确的类别。此外,如果两个类别的森林概率都在 50% 左右,那么网络也“不确定”哪个类别是正确的。

这样的结果是不是很明显?有解释吗?

1个回答

我认为您的神经网络可能正在学习与您的随机森林相同的特征。我不认为这很明显,因为很难说神经网络正在学习什么,但在这种情况下,根据您的模型,它可能工作相似。