在研究 Scikit-learn 的 kNN 算法时,我意识到如果我使用sklearn.model_selection.train_test_split,提供的数据会根据作为参数提供的比例自动分成训练数据和测试数据集。
然后基于训练数据,该算法查看最接近测试数据点的k-最近邻点,以确定测试数据点是否属于某个标准。
我想知道是否有一种方法可以预测测试数据集的标准,这些数据集已经是提供的数据集的一部分,而是在整个过程中没有提供的全新数据。
有没有办法使用 sci-kit learn 做到这一点?