这个问题源于 Pedro Domingos 的优秀论文“A Few Useful Things to Know About Machine Learning”。这篇论文非常清晰,写得很好,但我还有一个澄清问题。也就是说,Domingos 在第 1 页上描述的“学习者”和“分类者”之间有什么区别?我在很大程度上把这些当作同义词。在论文中让我陷入循环的句子是(再次在第 1 页):“学习器的测试是这个分类器是否为未来的示例xt产生正确的输出yt。” 我以为这只是分类器的测试。任何澄清或进一步阅读建议将不胜感激。
监督学习中的“学习者”和“分类者”有什么区别?
机器算法验证
机器学习
分类
监督学习
2022-03-22 22:09:08
2个回答
我过去常常在对机器学习感兴趣的程序员的世界中发现这种差异。这种差异不会出现在统计学家和研究人员的世界中。
这个想法是分类器是由学习者构建的程序。一种启发性的直觉来自机器学习的众多定义之一,即使用数据进行编程。因此,您有数据(训练集),并使用计算机程序从该数据中构建另一个程序(例如决策树)。从数据构建决策树的程序是学习器。决策树是一个分类器,因为分类器是一个能够预测的程序,它只接受输入数据,并为每个实例生成输出数据。
理解这一点的另一种方法是学习器接受输入并生成分类器。分类器将作为输入并产生。
正如我所说,在研究论文中很难找到这种区别。似乎研究人员只对如何描述模型感兴趣。当他们开始描述如何构建该模型时,他们会谈论学习器,当他们谈论如何使用该模型进行预测时,他们会谈论分类器。因此,第三种选择是功能性的。拟合模型的功能是学习器的功能,而预测值的功能是分类器的功能。
请注意,回归器与分类器相同,只是输出的性质不同。
我知道这是一篇旧帖子,但我对 OP 有同样的问题。感谢/基于@rapio 的描述,这就是我要说同样的话的方式:
学习器和分类器都指的是同一个东西:机器学习模型。只是 ML 模型在训练阶段有一些方面,当模型用于推理时,这些方面会被隐藏和删除。
例如,在训练阶段,我们有一个优化器来指导反向传播算法如何更新模型权重。或者学习率。一旦模型完成训练,模型的这些部分就会被剥离。换句话说,你在推理时所拥有的模型与你训练它时的概念并不完全相同。这就是为什么在一些文献中,它们被称为不同的名称。
基本上,当您说“学习者”时,您是在强调仅存在于训练阶段的模型方面。就个人而言,我希望人们不要再吹毛求疵,而只是将其称为模型。在我看来,这种差异化程度对任何人都没有帮助。
其它你可能感兴趣的问题