监督学习中的“学习者”和“分类者”有什么区别?

机器算法验证 机器学习 分类 监督学习
2022-03-22 22:09:08

这个问题源于 Pedro Domingos 的优秀论文“A Few Useful Things to Know About Machine Learning”。这篇论文非常清晰,写得很好,但我还有一个澄清问题。也就是说,Domingos 在第 1 页上描述的“学习者”和“分类者”之间有什么区别?我在很大程度上把这些当作同义词。在论文中让我陷入循环的句子是(再次在第 1 页):“学习器的测试是这个分类器是否为未来的示例xt产生正确的输出yt。” 我以为这只是分类器的测试。任何澄清或进一步阅读建议将不胜感激。

2个回答

我过去常常在对机器学习感兴趣的程序员的世界中发现这种差异。这种差异不会出现在统计学家和研究人员的世界中。

这个想法是分类器是由学习者构建的程序。一种启发性的直觉来自机器学习的众多定义之一,即使用数据进行编程因此,您有数据(训练集),并使用计算机程序从该数据中构建另一个程序(例如决策树)。从数据构建决策树的程序是学习器。决策树是一个分类器,因为分类器是一个能够预测的程序,它只接受输入数据,并为每个实例生成输出数据。

理解这一点的另一种方法是学习器接受输入并生成分类器分类器作为输入并产生x1,x2,..,xp,yx1,x2,..,xpy

正如我所说,在研究论文中很难找到这种区别。似乎研究人员只对如何描述模型感兴趣。当他们开始描述如何构建该模型时,他们会谈论学习器,当他们谈论如何使用该模型进行预测时,他们会谈论分类器因此,第三种选择是功能性的。拟合模型的功能是学习器的功能,而预测值的功能是分类器的功能。

请注意,回归器与分类器相同,只是输出的性质不同。

我知道这是一篇旧帖子,但我对 OP 有同样的问题。感谢/基于@rapio 的描述,这就是我要说同样的话的方式:

学习器和分类器都指的是同一个东西:机器学习模型。只是 ML 模型在训练阶段有一些方面,当模型用于推理时,这些方面会被隐藏和删除。

例如,在训练阶段,我们有一个优化器来指导反向传播算法如何更新模型权重。或者学习率。一旦模型完成训练,模型的这些部分就会被剥离。换句话说,你在推理时所拥有的模型与你训练它时的概念并不完全相同。这就是为什么在一些文献中,它们被称为不同的名称。

基本上,当您说“学习者”时,您是在强调仅存在于训练阶段的模型方面。就个人而言,我希望人们不要再吹毛求疵,而只是将其称为模型。在我看来,这种差异化程度对任何人都没有帮助。