滞后功能

数据挖掘 时间序列 预测建模 特征选择 特征工程 数据科学模型
2022-03-15 20:44:09

例如,让我们看看零售店的销售额预测。

如果我正确理解了这个概念,那么滞后特征将是上个月 t-1 的销售额。

创建一个特征的滞后特征是否有意义/是常见的做法吗?例如上个月 t-1 的客户数和客户数。

我会担心这样做,我会过分重视不重要的功能。

1个回答

特征的滞后值对时间序列数据有意义,这通常是时间序列分析的基础(因为自相关)。现在,你是否应该包含一个特性的滞后是一个不同的问题,一个非常依赖于数据和模型的问题,所以我们不能明确地回答这个问题。

您可能要检查的一件事是上述自相关,如果一个特征具有自相关,那么也许您应该包括滞后,但是如果没有自相关,那么滞后可能是无用的。