我认为技术的选择很大程度上取决于你的预测需要有多细。
当谈到通过强化学习 (RL) 进行预测时,一个突出的例子是股票交易 RL 代理。代理人必须决定买入或卖出哪只股票,从而利用与某些股票的预期未来发展相一致的预测。鉴于这种方法,您不一定要让 RL 代理明确生成股票价格在任何时候将如何发展的估计,而是您只会观察有关是否买入或卖出等的预测决策。
但是,如果你想得够深,我敢肯定,你可以想出 RL 代理的设置,让你明确地生成对要预测的值的未来估计。在这种情况下,最终的买入/卖出决定必须依赖于明确的未来股票价格预测来执行准确的预测。
关于无监督学习,您可以根据某些感兴趣的值如何变化来聚类数据点(训练样本)t未来的时间步长(在观察了训练样本之后)。然后,您可以将集群与粗略的预测估计相关联。毕竟,您会将预测值视为与数据点关联的标签。
之后,您可以使用某种最近邻方法来确定哪个集群最接近某个新的数据样本。然后,您将与最近的集群/原型等相关联的预测预测(即标签)作为新数据样本的预测。但严格来说,一旦您开始转换预测值(以前是一些未标记的部分时间序列数据集)转换为标签,您当然可以将训练过程再次转换为监督技术。
特别是后一种训练方法的效果如何,我无法判断,因为我从未听说过有人使用这种方法。但是,如果训练数据太稀缺而无法采用某种深度学习方法,如果准确性不必太精确,为什么不至少尝试一下呢?
毕竟,这只是创造力和测试哪种方法最适合您手头的特定机器学习问题的问题。