我有按出现顺序排序的用户执行命令序列的数据集。数据看起来像这样。
user1 : cmd1->cmd2->cmd3->...->cmdnuser2 : cmd1->cmd2->cmd3->cmd5->...->cmdnuser3 : cmd6->cmd2->cmd4->cmd5->...->cmdn
所以这个想法是根据类似于点击流预测的先前命令或命令序列来预测按概率排序的下一个用户命令。
我已经尝试过1st-order Markov Chain,但它仅基于先前的命令,并且更高阶的马尔可夫链效率不高,因为序列可能非常长,具有许多不同数量的命令。
有没有其他方法可以解决此类问题?