人工智能 - 与复杂的神经网络函数相比，线性逼近器是否更适合某些任务？ - 吾爱随笔录

人工智能强化学习控制问题基于模型的方法线性规划

2021-11-02 10:27:53

基于模型的 RL 尝试学习函数 $f(s_{t+1}|s_t, a_t)$ 表示环境转换，也称为系统模型。我看到线性函数仍在基于模型的 RL 中使用，例如在机器人操作中学习系统动力学，并且可以很好地工作。（这里，我的意思是学习模型，而不是作为控制器选择最佳动作的优化方法）。

在基于模型的 RL 中，是否存在学习线性模型（例如使用Lyapunov 函数）比使用神经网络更适合的情况，或者是在使用基于模型的 RL 解决问题时使用线性模型构建的问题示例?

1个回答

这只是监督学习的一个例子。你试图预测 $s_{t+1}$ 给定 $s_t$ 和 $a_t$ ，所以你的问题的答案取决于你的状态动态有多复杂。

例如，如果状态空间非常复杂，例如，如果您的状态空间是一张图像，并且您想在给定当前图像和动作的情况下预测下一张图像，那么线性方法不太可能很好地工作。

其它你可能感兴趣的问题