我有一个包含 5 个特征的数据集,对应于 5 个传感器,每三秒测量一次加速器的状态。它的结构也是:
Sensor 1 | Sensor 2 | Sensor 3 | Sensor 4 | Sensor 5 | Label
1.5 1.1 0.8 1.2 1.2 0
1.2 1.4 1.4 1.4 1.1 0
1.2 1.1 1.2 1.3 1.5 0
标签指示时间序列是异常(=1)还是非异常(=0)。我有一个异常检测任务,我选择的框架 ( 1 , 2 ) 给我一个长度为 3 的数组作为输出,其中我预测了标签:(0, 1, 0)。我通常使用异常检测框架,它给了我一个阈值,我可以很容易地将高于它的值标记为异常。
在这种特定情况下,使用这个长度为 3 的数组,假设我可以这样重写以下数据集是否正确?(真 = 异常,假 = 正常)
Sensor 1 | Sensor 2 | Sensor 3 | Sensor 4 | Sensor 5 |
False False False False False
True True True True True
False False False False False
那么,不是一次标记一个值,而是直接将所有时间序列标记为异常?