具有滞后因变量和自变量的时间序列回归

机器算法验证 时间序列 预测 有马 自回归的
2022-03-21 20:46:54

我有航空旅客、油价和失业率的月度数据。我正在尝试创建一个模型来使用石油价格和失业率作为解释变量来预测航空旅行需求,但面临一些问题: - 乘客数据以 t 年两个月之间的百分比变化来衡量,减去同月的百分比变化前一年。我已将此模型制作为季节性 arima (0,1,1)*(0,1,1),即众所周知的航空公司模型。我如何计算一个模型,其中包括油价和失业率的滞后来预测乘客的百分比变化?我希望它是一个模型,可以使用时间序列预测和滞后油价可能具有的任何解释力来进行预测。您对模型、类似研究、方法等有任何想法,我将永远感激不尽。

1个回答

首先,您应该决定使用单变量或多变量模型。认为油价和失业是航空旅行需求的原因似乎是合理的,而不是相反。因此,根据这篇文章的答案之一,您可以在单变量环境中解决您的研究。如果前面的假设不合适,那么您可以采用多元方法,例如@Miha Trošt 提到的 VAR 模型。

在单变量设置中,您可以考虑以下模型:

  • ARIMAX 模型:这些是 ARIMA 模型作为您选择的模型,其中包括外生回归器。
  • 分布式滞后模型:这些模型基于回归方程,其中包括解释变量的滞后版本。
  • 自回归分布滞后模型,与以前的模型一样,但也包括因变量的滞后作为回归量。

您是否检查了航空公司模型应用的常规和季节性差异过滤器是否必要?您提到该系列是以速率衡量的,这可能已经使该系列静止。这不是一定要满足的,我没有看到数据,所以这只是一个猜测。

您还应该关注回归变量之间的相关性。油价和失业率可能相关。如果存在相关性并且相关性很高,则对参数的估计可能不准确。如果相关性很高,您可以只包括其中一个回归量。有一些技术可以处理多重共线性,但只有两个回归变量可能不值得使分析过于复杂,并且保留这​​两个变量可能是安全的,除非它们高度相关。