两个经验估计的马尔可夫链在统计上是否不同?

机器算法验证 假设检验 统计学意义 马尔科夫过程
2022-03-31 21:58:54

我正在构建马尔可夫链(具有 100 到 200 个状态)并通过简单地计算我在原始数据中看到每个转换的次数(每个数据集大约 20k 到 60k 转换)来凭经验推断转换概率。请注意,适度的转换数量和适当的状态数量导致每个边缘的平均测量次数在 1 到 12 之间,因此大多数推断的转换概率的误差都相当高。

从每个数据集中,我构造了一个马尔可夫链。给定两个马尔可夫链,我想要一个统计测试来告诉我它们是否相同(两者都试图近似相同的未知“真实”马尔可夫链,或者两个不同的)。有什么建议吗?任何现有代码(最好在 Matlab 中,但 R 很好)?

2个回答

由于假定两条链具有可比性,因此它们应该具有相同的状态空间。这留下了转换矩阵,可以通过基于散度的假设检验来进行比较,如pg 所述。139基于散度测量的统计推断作者 Leandro Pardo Llorente

这是半生不熟的想法。请告诉我为什么它是错误的。:)

  1. 从数据集 A 中随机选择一个状态序列,并在为该数据集构建链时将其省略。
  2. 为数据集 A 和 B 构建链。
  3. 通过链 A 和 B 运行序列,并记录预测的最终状态。
  4. 重复1-3次。
  5. 报告链预测相同最终状态的次数百分比。