实践中的在线学习

机器算法验证 机器学习 参考 在线算法
2022-04-01 04:12:05

是否在实践中使用在线学习/优化?我看到很多论文,他们提到文档排名、股票预测、在线广告展示作为在线学习的示例应用。它是否在工业中实际使用/评估?是否有任何白皮书支持或反对使用在线学习?

3个回答

当您可以同时使用这两种方法时,没有理由更喜欢在线学习而不是批量学习。

但是在某些情况下(数百万个特征,数百万个观察值),您必须使用在线学习,因为其他一切都会失败(或不会终止)。

在线学习方法的一些实现甚至具有恒定的内存占用(散列特征并允许冲突)。

例如,点击率 (CTR) 预测通常使用在线算法来解决。Ad Click Prediction: a View from the Trenches是一个很好的概述。

在实践中使用在线学习有两个主要原因:

  1. 当并非所有数据都适合内存时;
  2. 当数据实时到达并且每个到达数据的处理能力较低时。

RUser4512在他的回答中给出了场景 1 的一个很好的例子

场景 2 在工业应用中非常常见。例如,随机梯度下降和自适应滤波技术已经在电子和控制领域使用了几十年。

这是关于在具有嵌入式 Nios 软处理器技术的 Altera Stratix FPGA 上实现基于 CORDIC 的 QRD-RLS 算法的高效递归回归算法实现的白皮书

在线学习在非平稳情况下也很有用。您可能想要跟踪信号或系统的变化。