机器学习模型指南

数据挖掘 机器学习
2022-03-13 18:29:28

我正在尝试第一次构建机器学习模型,并且正在寻找一些指导方针。
我的最终目的是确定计划出国飞行的客户。
从我现有的数据中,我确定了过去飞行的客户,并且我标记了一些可能表明一个人即将飞往国外的潜在变量(特征)。

我的问题是:
1. 我应该使用什么技术来为我的模型选择正确的特征?
2. 你会在这样的问题中使用什么方法(模型)?

因为这是我第一次体验 ML,我很高兴听到您给我的任何进一步建议。

您的帮助将不胜感激。

1个回答

您应该使用哪种算法是有争议的,有时取决于人

如果您追求准确性,那么随机森林是一个很好的起点(如评论中所述),但我个人喜欢逻辑回归作为此类问题的起点,因为它们具有不错的准确性并且相对易于解释。

但是,如果这是您的第一个机器学习问题,我建议您先进行一些更广泛的阅读,了解如何制定和处理机器学习问题。

它会给你一个视角来决定你自己使用哪个模型。此外,您可能需要进一步解释您的模型选择,并且使用“一些来自堆栈溢出的家伙告诉我使用它”的借口不会减少芥末。

链接:

如何解决机器学习问题

Python 中的机器学习简介