分类模型精度低

数据挖掘 机器学习 分类 预测建模 预报
2022-02-13 04:30:31

几个月以来,我一直在研究从销售线索到销售的预测。有人在我的网站上进行销售,我想预测该用户是否会进行销售。我在测试数据上有这些指标。

在此处输入图像描述

现在,例如,当我检查 May_2020 月份的所有潜在客户时,我预测为 1(概率 >=0.5)并与实际销售额进行比较,我收到 22% 的转化率。这意味着,只有 22% 的预测有 1 个潜在客户成为销售。你怎么看?

  • 这是因为精度低造成的吗?精度类似于转化率,或者这只是运气还是精度暗示了转化率。
  • 知道如何减少这个 78% 的大错误吗?
2个回答

精度给出了模型预测的总正数中正确预测的正数的百分比。因此,您的模型转换率低是由于精度低。查看支持,这看起来像是一个类不平衡问题。92% 的训练示例属于“0”类。因此,在训练时,您的模型有更多的“0”类示例可供学习。

有几种方法可以解决这个问题:

  1. 过采样- 当您从少数类中随机抽取带有替换的样本并在训练集中使用它时
  2. 欠采样- 这是当您从有或没有替换的多数类中抽取随机样本,并在学习时减少给予模型的多数类的示例数量。
  3. 合成采样- 还有像 SMOTE 这样的技术可以合成生成少数类的样本。

这些只是我强调的几个技术。您可以查看此链接以进一步阅读https://machinelearningmastery.com/tactics-to-combat-imbalanced-classes-in-your-machine-learning-dataset/

1.转化率其实就是模型的精度。
您的低转换率是因为精度低,因为您的数据集大部分由 0 组成。
这就是为什么 0 的精度与 1 相比相当高

2.关于你的第二个问题,为了提高精度,你可以上传你预测结果的数据集吗