我应该将二进制特征与其他数字特征一起缩放吗?

数据挖掘 数据挖掘 特征选择 数据清理 特征缩放
2022-02-18 11:17:56

当我清理我的数据时,我有一些包含大量数字的特征和一些二进制特征。我应该缩放大型特征然后添加二进制列还是一起缩放它们?

我担心的是,将它们全部缩放在一起会使二进制特征看起来不如实际重要。

注意:我正在为二元分类准备一个神经网络。我正在使用 sigmoid 输出并从 [0,1] 缩放我的特征

1个回答

您需要了解两个重要的概念。

  • 缩放特征不会影响它们在神经网络中的“重要性”

直观地说,您的神经网络本身将通过学习权重来学习哪个特征重要或不重要。

  • 缩放特征将加快收敛速度​​,并限制超调或陷入局部最优的风险。它也具有数字意义。

直观地说,缩放特征可以让你的训练更快,因为如果你的特征被缩放,你的“收敛路径”可能会更短(右图)。

缩放特征也具有数值意义,因为如果您有非常大和非常小的值,您的某些权重可能会下降得非常低,这可能会导致一些数值问题并阻碍模型的性能。

在此处输入图像描述