我对神经网络很陌生。我正在使用 Keras(TensorFlow 后端)在具有大约 5000 个观察值和 4 个特征的数据集上运行一个简单的 ANN。
我在神经网络中尝试不同的参数和类似的东西,然后绘制训练和测试错误。例如,我增加/减少了 batch_size,我增加/减少了 epoch 的数量,我增加/减少了我使用的数据量,我增加/减少了第一个也是唯一一个隐藏层中的节点数量,我增加/减少了数量隐藏层等等。
绘制训练和测试错误表明其中一些可能导致过度拟合。所以这是我的问题:
NN 的哪些特征会导致过度拟合?我错过了哪些?[一般来说!]
- 增加/减少批量大小。
- 增加/减少 epoch 大小
- 增加/减少第一个隐藏层(或其他层)中的神经元数量。
- 增加/减少隐藏层的数量
我的猜测是增加神经元和层的数量会导致过度拟合。增加 epoch 的数量不会,而增加批量大小可能会导致过度拟合。
这个对吗?与我们拥有的样本数量无关,其中哪些可能导致过度拟合?为什么?
此外,神经网络的哪些其他特征可能导致过度拟合?