数据挖掘 - 识别字节数组中的重复数据序列 - 吾爱随笔录

给定一个十六进制数据样本，我想识别在整个样本中重复的 UNKNOWN 字节序列。（不搜索已知字符串或值）我正在尝试对网络协议进行逆向工程，并且正在确定数据包中的数据结构。作为我正在尝试做的一个例子（尽管规模较小）：

(af:b6:ea:3d:83:02:00:00):{21:03:00:00}:[b3:49:96:23:01]

{21:03:00:00}:(af:b6:ea:3d:83:02:00:00):01:42:00:00:00:00:01:57

和

(38:64:88:6e:83:02:00:00):{26:03:00:00}:[b3:49:96:23:01]

{26:03:00:00}:(38:64:88:6e:83:02:00:00):01:42:00:00:00:00:00:01

显然，这些很容易通过肉眼发现，但数据中包含数百个字符的模式则不然。我并不期待解决方案的灵丹妙药，只是朝着正确的方向轻推，甚至更好的是预制工具。

我目前在 C# 项目中需要这个，但我对任何和所有工具都持开放态度。