我刚刚开始使用隐马尔可夫模型。在选择我的可观察变量时,我认为变量的最近变化可能比其水平更具预测性。例如,在金融领域,利率水平可能不如它最近的变化那么重要。
鉴于 HMM 假设只有当前状态很重要,如果我以这种方式使用变量的增量,我是否违反了最佳实践?我应该注意哪些潜在的陷阱?
我刚刚开始使用隐马尔可夫模型。在选择我的可观察变量时,我认为变量的最近变化可能比其水平更具预测性。例如,在金融领域,利率水平可能不如它最近的变化那么重要。
鉴于 HMM 假设只有当前状态很重要,如果我以这种方式使用变量的增量,我是否违反了最佳实践?我应该注意哪些潜在的陷阱?
您的问题是,如果您在 HMM 中使用 delta,您是否违反了最佳实践,以及是否存在任何陷阱。
我认为要回答第一个,并防止第二个,您可以做在人们想要使用 HMM 同时使用来自多个先前状态的信息的情况下经常做的事情:重写潜在链,使其变为“再次标准的马尔可夫链。这可能需要一些争论,但可以防止违反马尔可夫属性和您担心的任何潜在陷阱。
说你原来的潜链是. 您可以将其重写为.
这然后满足满足有限地平线假设的意义,它只依赖于.
根据您的特定用例,确保还调整原始状态的定义
在机器学习中,特征需要有变化才能使模型有能力学习使用它们。如果特征中没有差异,则该特征不能有助于在目标值之间进行预测。隐马尔可夫模型 (HMM) 是一种机器学习,因此需要特征方差。
大多数机器学习模型都能够学习哪些特征对任务很重要。因此,为模型提供原始特征往往会奏效。原始观察变量应提供给 HMM 模型,模型将学习使用它们。
这个问题也可以通过交叉验证来回答。为模型提供原始特征和增量版本,看看哪个版本的预测能力最强。