不同的分类器将如何在特定数据集上执行

数据挖掘 决策树 朴素贝叶斯分类器 k-nn
2022-02-14 23:06:25

我正在阅读并学习不同的 ML 方法如何处理不同类型的数据,但我遇到了一个数据集,我不确定决策树、朴素贝叶斯和 KNN等 ML 方法将如何处理以下数据套(对不起,我找不到更清晰的图像)。X1~X6 为区分属性,X7~X14 为噪声属性。我真的很感激每种 ML 方法如何将这些数据集拟合到模型中,以及它们各自对这些特定数据集的优缺点是什么。

资料一: p1

资料乙:

p2

1个回答

从图中可以清楚地看出,非线性模型可以很好地区分 A 类和 B 类。线性模型(逻辑回归)为此类数据集提供了大约 50% 的准确度具有内核技巧的非线性模型(例如 -SVM )可以为您提供非常好的准确度。按照此链接查看非线性数据集的逻辑回归和 SVM 之间的实际区别