强化学习是无监督学习的一个子集吗?

数据挖掘 机器学习 强化学习
2022-03-11 06:12:52

根据这篇文章

另一方面,强化学习是无监督学习的一个子集......

这句话的真实性如何?有没有关于强化学习分类的学术讨论/写作?

2个回答

强化学习与无监督学习不同,因为它以奖励函数的形式使用有关代理预期行为的附加信息。但是,它也不同于监督学习,因为它不需要任何标记数据进行训练或测试。

所以,两者都不是。您也可以参考强化学习的 wiki 页面了解更多相关细节。

不,强化学习和无监督学习被认为是两种不同的范式。

我们可以参考 Christopher Bishop 的开创性书籍Pattern Recognition and Machine Learning来了解它们各自的定义:

  • 无监督学习:

    在其他模式识别问题中,训练数据由一组输入向量 x 组成,没有任何对应的目标值。此类无监督学习问题的目标可能是发现数据中的相似示例组(称为聚类),或确定输入空间内的数据分布(称为密度估计),或将数据从高- 为了可视化的目的,将空间缩小到二维或三个维度

  • 强化学习:

    最后,强化学习技术 [...] 关注在给定情况下寻找合适的行动以最大化奖励的问题。

如您所见,它们的目标完全不同:在无监督学习中,我们没有标签,我们的目标是发现数据的结构,而在强化学习中,我们希望学习一种策略,以根据奖励信号。