偏自相关和自相关差

数据挖掘 时间序列 相关性
2022-02-12 00:56:49

我一直在努力更好地理解 PACF 和 ACF,但我确实在苦苦挣扎。

一直在使用一系列文章,例如: https ://machinelearningmastery.com/gentle-introduction-autocorrelation-partial-autocorrelation/

即使查看PACFACF的 statmodels 的方法签名,我仍然无法得到它。

有人可以这么好心地用一些例子来做一个“傻瓜”的解释,说明在考虑数据时会发生什么?

是否正确地说,除其他外,

  • ACF 是自回归 (AR) 建模的图,而
  • PACF 做同样的事情,但对于移动平均线 (MA)

还是相反?

  • ACF 是移动平均线 (MA) 建模的图,而
  • PACF 做同样的事情,但对于自回归 (AR)。
1个回答

晚上好,

让我们从一个简单的例子开始:你有一个时间序列过程,例如一些相关性高达滞后 4 的过程。

订单 ( p ) 过程是时间序列过程,其中当前值取决于先前的p值。您可以考虑超市每周销售额的示例,在这种情况下,您的 AR(4) 模型显示您当前的每周销售额取决于前 4 周的销售额(第 1 周、第 2 周、第 3 周和第 4 周) )。

现在,让我们进入 ACF 和 PACF。

你有你的 AR(4) 模型,它基本上告诉你点的相关性直到滞后 4,这意味着你在 wk 1 和 wk 5 之间的相关性与 wk2 和 wk 6 之间的相关性相同(注意它们之间的“距离”是 4 个滞后)。类似地,对于任何数量的滞后 <4,此规则的工作方式相同:corr wk 1 和 wk 2 与 wk 2 和 wk 3 相同,依此类推。假设滞后 1(wk 1 和 wk 2)的相关性强于滞后 2(wk1 和 wk 3),这意味着随着滞后数量的增加,自相关也会降低。在每个进一步的滞后中,来自先前滞后的信息都会延续。这是一个可视化

PACF 是一个完全不同的概念。它主要关注的是找出特定滞后的两点之间的相关性。在您的情况下,假设您想找到 wk4 和 wk3 之间的“独立”相关性,这正是 PACF 将向您展示的内容。这是一个可视化

加在一起:wk4 的 ACF 数据将包括直到 wk3 的所有信息(wk1、wk2、wk3)。wk4 的 PACF 数据将仅包括 wk3 和 wk4 之间的“独立”(部分)相关性(这意味着它将通过这些点之间的相关性来解释,而这些点之间的相互相关性并未得到解释。

对于您关于 AR 和 MA 流程的观点,情况正好相反。ACF 变得非常小的滞后是 MA 过程的顺序。而PACF变得非常小的滞后是AR过程的顺序。

希望这可以帮助。