海德曼的季节性调整

机器算法验证 时间序列 估计 有马 季节性 效率
2022-04-02 13:07:04

Rob J. Hyndman在这里这里有两个关于预测每周系列的帖子。他建议使用带有 ARIMA 错误的回归,

yt=a+k=1K(αk sin(2πkt/m)+βk cos(2πkt/m))+Nt

在哪里Nt是一个 ARIMA 过程,m=365.25/7是季节周期和K可以使用 AIC 进行选择。

该模型似乎暗示了一种复杂的季节性形式(而不是附加的季节性——我认为它很简单)。另一方面,如果季节性是相加且恒定的(不随时间变化)并且没有确定性的时间趋势,那么似乎更合理的方法是

第一阶段:估计

yt=a+k=1K(αk sin(2πkt/m)+βk cos(2πkt/m))+εt

在哪里εt是误差项(在第 1 阶段我们没有在其上放置任何结构),然后获得拟合值y~t.

第二阶段:模型y~t作为 ARIMA 过程。

第 2 阶段:对残差建模ε^t作为 ARIMA 过程。

第 1 阶段和第 2 阶段可以按顺序完成而不会损失效率,因为傅立叶项是确定性的,并且将(渐近地)与其他回归量不相关。(该论点适用于线性回归,但可能不适用于 ARIMA 模型——我不确定。)

问题:

  1. 我在某些时候错了吗?
  2. Rob J. Hyndman 的方法何时会优于两阶段方法?

(我在这里的主要兴趣实际上是季节性调整而不是预测。)

1个回答

首先,该模型涉及附加季节性。它并不复杂——只是季节性项的简单傅里叶近似。是的,原帖漏掉了系数的下标;随后对该帖子进行了编辑。

在您提案的第 1 阶段,您忽略了残差中的自相关,这意味着对系数的估计很差。将自相关考虑在内要好得多。此外,如果您不考虑自相关误差,AIC 将是错误的。

在第 2 阶段,您将 ARIMA 模型拟合到拟合值。这没什么意义。拟合值将是纯周期性的。您需要对残差进行 ARIMA 处理。

你说第 1 阶段和第 2 阶段可以按顺序完成是错误的。相关的错误很重要。仅仅因为傅立叶项是确定性的并且可能与其他回归量不相关并不能使估计有效。