具有两个目标(分类、回归)的模型?

数据挖掘 机器学习 Python 分类 回归 机器学习模型
2022-03-15 20:32:41

我有一个数据集,其中包含 Cylinders、Transmission、ExteriorColor、OdometerReading、StockType(New/Old)、MakeModel、ModelYear、SoldYearMonth、CountSoldByMonth、Price、TopSelling 等功能。

如果特定的 MakeModel 是一个月内销量最高的 5 辆汽车,则目标列为 1。因此,鉴于 60 个月的数据,我必须预测接下来几个月最畅销的汽车。我还必须预测车辆的价格。所以我想,我需要同时做 Classification 和 Regression 。

MSRP   Cylinders   Transmission   ExteriorColor   OdometerReading   StockType     MakeModel            SoldYearMonth   CountSoldByMonth   Price   TopSelling
42098      8            MYC            Black           70348           Used    Chevrolet Tahoe            5/1/2019           10           39998     0
26390      4            MNK            Black            10             New      Buick Encore              5/1/2019           31           26390     1

等等.. 建议零售价和价格并不总是相同的。

我该如何解决这个问题?

2个回答

您还可以考虑使用 Keras 功能 API 的多输出模型(请参阅“使用 R 进行深度学习”,第 7 章,第 224 页)。这是各自的Keras 文档网上也有一些教程。我不确定 NN 是否适合您的问题,但这是一个可以考虑的选项。优点是您的模型还可以在学习时考虑特征和两个输出之间的相关性(这可能会产生更好的结果)。

虽然我不确定什么是建议零售价,但仍然对于您期望两种不同行为的此类问题,我建议进行两种不同的模型培训,

  1. 用于分类
  2. 对于回归

因此,您必须使用相同的功能集训练两种不同的模型,一种用于价格,另一种用于最畅销的模型。

注意:您可以将价格用作分类问题的特征(以及其他特征),并将畅销值用作回归问题的特征。