用于股票收益预测的 LSTM

数据挖掘 机器学习 lstm 损失函数 rnn
2022-02-22 02:41:16

我正在写我的硕士论文,并使用 LSTM 进行每日股票回报预测。到目前为止,我只是在预测数值,但很快就会探索一个分类风格问题,并预测它每天会上升还是下降。

我探索了几个场景

  • 仅使用过去 50 天作为输入的单个 LSTM 返回数据
  • 仅使用过去 50 天返回数据作为输入的堆叠(2 层)

结果对两者都不是很好(我没想到会如此)。所以我尝试了一些特征工程,使用 3 天 MA、5 天 MA、10 天 MA、25 天 MA、50 天 MA 的每日收益以及实际的每日收益,这意味着我有 6 个输入特征。所有其他变量保持不变,但模型现在过度拟合(请参阅下面的训练和测试损失图)。有谁知道为什么会这样?

橙色为测试损失,蓝色为训练 橙色为测试损失,蓝色为训练

1个回答

我不确定这种类型的模型是否适合特定任务。更具体地说,引用 Python 深度学习一书中的 Chollet,

永远记住,当谈到市场时,过去的表现并不能很好地预测未来的回报——后视镜是一种糟糕的驾驶方式。另一方面,机器学习适用于过去可以很好地预测未来的数据集。

— 使用 python 进行深度学习,Francois Chollet

这里主要争论的是,股票历史数据不是一种基于其自身基础分布而重复出现的现象。