- 在不同的时代,以下哪一项是更新的?
初始权重(初始 ConvNet 滤波器矩阵,初始全连接权重)
超参数:ConvNet 过滤器的数量、ConvNet 过滤器的大小、层数……
- 从上一个时期计算的丢失函数似乎是当前时期丢失函数的初始值。为什么?
初始权重(初始 ConvNet 滤波器矩阵,初始全连接权重)
超参数:ConvNet 过滤器的数量、ConvNet 过滤器的大小、层数……
您正在更新网络参数,即完全连接层的权重、卷积操作中的过滤器等。一旦开始训练网络,超参数就固定了。超参数不是学习过程所固有的,从业者应该使用 GridSearch、贝叶斯优化和交叉验证技术仔细调整。
在训练期间你只有一个损失函数,在每批处理中你更新你的权重来纠正你的网络,至少在理论上,减少你的损失函数。所以在第一个 epoch 之后,你已经达到了某个值,这将在下一个 epoch 更新。想一想你在山顶上,你正在往下爬,为了不累,你数了十步,稍作休息,10步后你又不在山顶了,你是从停下来的地方往下走, 对?这是一个类比(我认为这很糟糕,但如果你理解它就可以了哈哈)。