在学习机器学习时,我了解到在开始尝试建模之前定义问题的重要性。
我可以看到 2 种类型的问题分类:
- 有监督/无监督/强化算法
- 分类/聚类/回归/排名
在网上找到的示例定义:
第一种:
- 监督算法:训练数据集有输入和期望的输出。在训练期间,模型将调整其变量以将输入映射到相应的输出。
- 无监督算法:在这个类别中,没有目标结果。这些算法将为不同的组对数据集进行聚类。
- 强化算法:这些算法经过训练以做出决策。因此,基于这些决定,算法将根据输出的成功/错误进行自我训练。最终通过经验算法将能够给出良好的预测。
第二种:
- 分类:您想要一个算法来回答二进制是或否问题(猫或狗,好或坏,绵羊或山羊,你明白了),或者您想要进行多类分类(草、树或灌木;猫,狗或鸟等)您还需要标记正确的答案,以便算法可以从中学习。
- 聚类:您需要一种算法来查找分类规则和类数。与分类任务的主要区别在于,您实际上并不知道分组及其划分的原则是什么。例如,这通常发生在您需要细分客户并根据其质量为每个细分定制特定方法时。
- 回归:您希望算法产生一些数值。例如,如果您花太多时间为您的产品确定合适的价格,因为它取决于许多因素,回归算法可以帮助估计这个值。
- 排名:一些机器学习算法只是根据一些特征对对象进行排名。排名被积极用于推荐视频流服务中的电影,或者显示客户根据他或她之前的搜索和购买活动很有可能购买的产品。
每种类别都有名称吗?这些类型是相关的还是独立的?
