时间序列的可变相似性连接

数据挖掘 时间序列 聚类
2022-03-10 05:59:19

我目前正在尝试为时间序列数据实现 MPdist(矩阵轮廓距离)算法,但我开发了一个新的距离度量,我想用它来代替欧几里得度量。我已经实现了一个在技术上有效的算法,但是我使用蛮力来计算我正在使用的每个时间序列的每个子序列之间的距离。

因此,它的效率非常低下。我想使用相似性连接算法来降低复杂性。尽管如此,它们确实不是我的专业领域,而且我见过的大多数算法都不是很透明,并且关键使用欧几里德距离来计算 1NN 相似性连接。

有人可以给我指出一篇可能更透明的文章,这样我就可以更容易地用另一个度量替换欧几里得度量?或者一个 github repo 什么的。我只需要1NN

1个回答

动态时间扭曲可能是您正在寻找的:它基于两个序列之间的最佳对齐来测量两个时间序列之间的相似性。例如,基于序列的演化,序列 1 中的点可能与序列 2 中的点更好地对齐(与欧几里德距离相反,欧几里得距离总是将seq.1 中的进行比较)。对齐方法的灵感来自Levenshtein 编辑距离方法,该方法可以通过动态规划有效实现。ii+3ii

有许多可用的软件实现