编辑:我只想指出,我认为需要大卫和理查德的回答(和评论)来描绘全貌作为回应。对我来说,如果我所能做的只是强有力的预测并且对如何设置回归公式有很好的了解,我仍然没有真正需要从给定的回复中尝试时间序列框架,但我确实抓住了要点对系数和整体效率进行了解释(也许,我正在以“硬”的方式来做)。
我对像 ARIMA 这样的时间序列相关模型有点天真,因为与设置良好的预测回归模型相比,我似乎找不到它们的理由。由于自相关错误、季节性和外推等想法,网上的许多回复都指出线性回归的脆弱性,但在我看来,我可以通过良好的数据准备来适应其中的大部分:
- 季节性- 建模。如果有周期性的下降,我很幸运能用各种标志列(月、季度、甚至年等)捕捉到它们。
- 自相关- 包括滞后值。对先验值进行增量、滚动均值和各种统计数据似乎很有帮助。
- 外推——我看不出时间序列方法如何更好地驾驭这一点,因为很少有序列在未来是真正静止的。我发现从初始参考点(即开始后的几个月)保持运行计数似乎有助于总体方向趋势,并且在某些时候你需要重新训练。
除此之外,回归模型允许包含多个其他输入特征的标准方法(例如,如果预测销售,则市场数据)确实有助于外推困境,以及典型的“优化它以解决问题”框架的好处机器学习......我从来没有找到真正的时间序列路线的理由。
有人可以帮助解释我在实际用例中缺少什么吗?或者仅仅是回归模型在使用前确实需要仔细的数据建模?