我有一个数据集,我将使用它来构建分类器。下面我使用 绘制了数据的第一和第二主成分sklearn.preprocessing.PCA。由于两个不同的类没有很好地分开,所以线性分类器在这里不起作用。
我的问题是哪种分类器最适合这种情况。
我的研究带到了KNN。但我的直觉是,班级比例高度不平衡k,KNN 中的较大值总是倾向于较大的班级数量。训练它将是一场噩梦,SVM因为数据集中有许多观察结果,而且花费的时间太长。
我有一个数据集,我将使用它来构建分类器。下面我使用 绘制了数据的第一和第二主成分sklearn.preprocessing.PCA。由于两个不同的类没有很好地分开,所以线性分类器在这里不起作用。
我的问题是哪种分类器最适合这种情况。
我的研究带到了KNN。但我的直觉是,班级比例高度不平衡k,KNN 中的较大值总是倾向于较大的班级数量。训练它将是一场噩梦,SVM因为数据集中有许多观察结果,而且花费的时间太长。