是否应该仅将使用神经网络的预测视为监督学习(回归)问题?

人工智能 神经网络 强化学习 无监督学习 预测 半监督学习
2021-11-17 10:39:38

我最近做了一项关于神经网络在时间序列预测中的应用的工作,我将其视为监督学习(回归)问题。我遇到了将这个问题视为无监督、半监督或强化学习问题的建议。提出这个建议的人不知道如何解释这种方法,我也没有找到任何关于此的论文。所以我发现自己现在试图弄清楚但没有任何成功。据我了解:

无监督学习问题(聚类和分割减少)和半监督学习问题(半监督聚类和半监督分类)可用于分解时间序列但不能对其进行预测。

强化学习问题(基于模型和非基于模型的 on/off-policy)是针对决策问题,而不是预测。

是否可以将使用神经网络的预测时间序列视为无监督、半监督或强化学习问题?它是如何完成的?

1个回答

我认为技术的选择很大程度上取决于你的预测需要有多细。

当谈到通过强化学习 (RL) 进行预测时,一个突出的例子是股票交易 RL 代理。代理人必须决定买入或卖出哪只股票,从而利用与某些股票的预期未来发展相一致的预测。鉴于这种方法,您不一定要让 RL 代理明确生成股票价格在任何时候将如何发展的估计,而是您只会观察有关是否买入或卖出等的预测决策。

但是,如果你想得够深,我敢肯定,你可以想出 RL 代理的设置,让你明确地生成对要预测的值的未来估计。在这种情况下,最终的买入/卖出决定必须依赖于明确的未来股票价格预测来执行准确的预测。

关于无监督学习,您可以根据某些感兴趣的值如何变化来聚类数据点(训练样本)t未来的时间步长(在观察了训练样本之后)。然后,您可以将集群与粗略的预测估计相关联。毕竟,您会将预测值视为与数据点关联的标签。 之后,您可以使用某种最近邻方法来确定哪个集群最接近某个新的数据样本。然后,您将与最近的集群/原型等相关联的预测预测(即标签)作为新数据样本的预测。但严格来说,一旦您开始转换预测值(以前是一些未标记的部分时间序列数据集)转换为标签,您当然可以将训练过程再次转换为监督技术。

特别是后一种训练方法的效果如何,我无法判断,因为我从未听说过有人使用这种方法。但是,如果训练数据太稀缺而无法采用某种深度学习方法,如果准确性不必太精确,为什么不至少尝试一下呢?

毕竟,这只是创造力和测试哪种方法最适合您手头的特定机器学习问题的问题。