我正在预测每日交易量,并使用时间序列模型来检查数据的平稳性。但是,我正在努力以 90% 的准确率预测数据。现在变化非常大,我无法降低它。
我使用 log 方法来转换我的数据。请在下面找到包含 ipynb 和 csv 文件的文件夹的链接:
https://drive.google.com/drive/folders/1QUJkTucLPIf2vjo2mRmoBU6be083dYpQ?usp=sharing
任何帮助都将不胜感激
谢谢,拉胡尔
我正在预测每日交易量,并使用时间序列模型来检查数据的平稳性。但是,我正在努力以 90% 的准确率预测数据。现在变化非常大,我无法降低它。
我使用 log 方法来转换我的数据。请在下面找到包含 ipynb 和 csv 文件的文件夹的链接:
https://drive.google.com/drive/folders/1QUJkTucLPIf2vjo2mRmoBU6be083dYpQ?usp=sharing
任何帮助都将不胜感激
谢谢,拉胡尔
在任何事情之前,先画一个图表。
您会注意到您至少有三个进程:一个在 20-25 左右,一个在 60-90 左右,一个在 250-450 左右。仔细一看,你会发现第一个是周六,第二个是周日,最后一个是其他工作日。
进一步注意,周日系列自 2016 年 12 月 26 日以来有所不同。并仔细观察圣诞节和银行假期,以确定它们的行为是否像周六、周日或平常一样。
另请注意 2017-12-21 和 2018-01-02 之间的一组异常值。在适合之前将它们移除。到 2016 年 11 月,您也有生产过剩。也将它们删除。
然后做一个 7 天移动平均线,你会看到它是相当线性的,除了 2017 年 1 月的生产不足,你可能有一个外部解释(在 2017 年底的变化之后)。
通过这种线性拟合,您可以查看每周的季节性。并达到70-80%的准确率。
但是忘记 90% 的准确率。您的数据波动更大。