在神经网络训练的每个时期究竟发生了什么

数据挖掘 神经网络 深度学习 超参数调整 时代
2022-03-15 23:50:09
  1. 在不同的时代,以下哪一项是更新的?

初始权重(初始 ConvNet 滤波器矩阵,初始全连接权重)

超参数:ConvNet 过滤器的数量、ConvNet 过滤器的大小、层数……

  1. 从上一个时期计算的丢失函数似乎是当前时期丢失函数的初始值。为什么?
1个回答
  1. 您正在更新网络参数,即完全连接层的权重、卷积操作中的过滤器等。一旦开始训练网络,超参数就固定了。超参数不是学习过程所固有的,从业者应该使用 GridSearch、贝叶斯优化和交叉验证技术仔细调整。

  2. 在训练期间你只有一个损失函数,在每批处理中你更新你的权重来纠正你的网络,至少在理论上,减少你的损失函数。所以在第一个 epoch 之后,你已经达到了某个值,这将在下一个 epoch 更新。想一想你在山顶上,你正在往下爬,为了不累,你数了十步,稍作休息,10步后你又不在山顶了,你是从停下来的地方往下走, 对?这是一个类比(我认为这很糟糕,但如果你理解它就可以了哈哈)。