如何构建时间序列分类器

数据挖掘 分类 时间序列
2022-02-27 22:11:30

我有批量生产产品的化工厂数据。每批大约需要 4 个小时,我每 5 分钟就有一次数据。我的目标是将批次分类为好和坏。对于像这样的与时间相关的数据,我怎样才能做到这一点?

我读过的一种方法是时间展开,其中每个时间间隔与特征结合成为一个单独的特征(例如,如果有间隔 T0 和 T1,特征 F0 和 F1,那么我们将有 4 个特征 T0 F0 和 T1 F1) -如果我对展开有误,请纠正我。

所以基本上我们将每批 N 行数据转换为单行。还有其他方法吗?

1个回答

我不清楚您如何将 N 行转换为单行。你把它们全部连接起来吗?这是一个选项,但在较长的序列长度上可能会出现问题。

一种简单的方法可能是简单地对时间步长的特征进行平均。尽管您丢失了因果信息,但事实证明这对于词嵌入非常有效。

另一种标准方法是使用隐马尔可夫模型。非常简单,一个隐马尔可夫模型假设一个潜在状态空间,它在每个时间步生成一个输出(在这种情况下是你的特征),条件是前一个状态。 https://en.wikipedia.org/wiki/Hidden_​​Markov_model

今天的做法是使用序列神经模型,例如 LSTM 和 GRU,它们可以在更长的时间步长上保持记忆。 https://en.wikipedia.org/wiki/Long_short-term_memory

我建议您阅读这些方法并选择适合您目的的方法:)