预测相互作用

数据挖掘 机器学习 分类 ngram
2022-02-20 11:01:08

首先,我对机器学习知之甚少。

在虚拟世界中,例如我的世界之类的视频游戏或 Google 街景之类的应用程序,用户可以使用键盘和鼠标导航世界。

我正在寻找预测用户将执行的交互。例如,用户可能按住w一段时间(向前移动),然后按住a一段时间向左移动。或者,用户可以按住w并使用鼠标来转动和向上/向下看。

我研究过 N-Grams,我可以在一定程度上预测交互,但我没有考虑用户不执行操作的时间。我认为执行no action是正确交互预测的重要指标,因为“无动作”本身可以归类为交互。交互的持续时间也应该很重要,但同样,我不确定如何在模型中考虑这一点。我的 Ngram 模型只考虑过去的 3 或 5 个输入。

我想开发一些可以非常快速地预测交互(这是关键)并从错误中快速学习的东西。理想情况下,它将是“在线”,因为它不断“学习”。

我很想知道您认为哪些模型非常适合我的任务(ngrams 合适吗?),任何与我的任务密切匹配的示例,因此我可以采用以满足我的需求,任何包含用户交互的数据集以及我的应该看看来预测鼠标交互。

1个回答

有趣的问题。我没有过多地处理这类数据,但在我看来,大部分工作可能是特征工程。我所知道的每一种“监督”统计方法都要求您将数据硬塞到“结果”和“协变量”中。 YX. 一旦您的数据采用这种形式,您只需找到一个可以估计的合适算法

Y=f(X)

但是获取人们如何玩视频游戏的数据并将其转换为二维矩阵并不一定很明显。最困难的事情之一是您需要对不同用户的观察进行比较。

假设您正在玩 quake 3,并且您正在尝试预测用户是否会选择 BFG。你怎么定义Y? got BFG吗?或者应该是came within some distance of BFG(例如,也许人们搞砸了火箭跳)。如果他们在去 BFG 的路上被撞坏了怎么办?关键是定义结果涉及选择。

同样,协变量是什么?假设我在某个位置生成,并且我知道地图,然后立即向 BFG 移动。与在地图上其他地方生成的人相比,我将拥有一组不同的wasd击键。那么你想看的是n-gram吗?也许更确切地说,它是在某个时间间隔内产卵位置和 BFG 位置之间的欧几里得距离的变化。如果有,合适的时间间隔是多少?

通常,您所做的是获取原始数据并将其转换为该数据的抽象。这实际上是神经网络所做的。它需要原始数据X并形成该数据的低维表示,V, 在哪里V列数少于X. 当神经网络运行良好时,这些列V可能与人类从原始数据流中挑选出来的东西惊人地相似。类似于此: https ://www.youtube.com/watch?v=3vAnuBtyEYE

那些V然后只与你的结果有关Y在线性模型或逻辑回归中。

但是您不会将原始击键转换为blondebrunette并且redhead没有大量数据和较长的训练时间。如果您可以预先指定原始数据的功能,它会更快,这需要领域知识。