我正在尝试为 NN 培训的标准任务实施 GD :) 迄今为止我为从业者创立的最佳论文是:
1) Yann LeCun 等人的“Efficient BackProp”。
2) Leon Bottou 的“随机梯度下降技巧”
还有其他关于这个主题的必读论文吗?
谢谢!
我正在尝试为 NN 培训的标准任务实施 GD :) 迄今为止我为从业者创立的最佳论文是:
1) Yann LeCun 等人的“Efficient BackProp”。
2) Leon Bottou 的“随机梯度下降技巧”
还有其他关于这个主题的必读论文吗?
谢谢!