使用分类变量和时间进行预测的 ML 方法

数据挖掘 机器学习 时间序列 预言 分类数据
2022-02-22 17:30:44

我发现时间序列数据的大多数时间序列分析教程/教科书通常处理连续数值变量。我目前正在尝试解决一个处理多元时间序列数据的问题,其中字段都是分类变量。

具体来说,我的数据是一个警报数据流,在每个时间戳中,警报监控系统、警报类型、问题位置等信息都存储在警报中。这些字段都是分类变量。

我的数据与另一个问题中描述的数据非常相似,所以我使用了类似的描述。但是我的问题有点笼统。

给定一系列警报,使用 ML 预测下一个警报的位置和类型(在 t(1) 处),了解常见警报模式和 t(0)、t(- 1), t(-2), ...t(-n) ?

1个回答

解决复杂离散状态模式预测问题的一种方法是概率图形模型 (PGM)。PGM 对相互交互的大量随机变量的联合(多变量)分布进行建模。

PGM 没有线性时间的概念。他们模拟状态。给定当前状态和之前的状态,下一个时间步中其他状态的可能性有多大?在您的问题中,状态是警报的类型和位置。

PGM 的常见示例是隐马尔可夫模型 (HMM) 和条件随机场 (CRF)。