我是机器学习领域的新手,我正在评估一些工具等以了解它。
对于一个项目,我正在使用一个工具来创建一个预先计算的内核(gram 矩阵)并且还能够对其进行规范化(0 到 1 之间的值)。
我的问题是,在使用预计算内核时,我无法预测除训练集之外的任何内容。
简短总结问题描述:
- 原始数据集是 1285 个实例
- 通过使用将其拆分
k_folds = sklearn.cross_validation.StratifiedKFold(list_of_annotations, k=5)为5折(手动拆分,使用方法中的索引) 运行(目前仅用于测试目的)
`分类器= svm.SVC(内核='预计算',概率=真)
clf = classifier.fit(train_matrix, train_annotations)--> 似乎工作/没有问题,直到这里
clf.predict(test_matrix)给我以下错误消息:
ValueError: X.shape[1] = 257 should be equal to 1028, the number of samples at training time
我的方法错了吗?
我不太了解错误消息 - 如果我使用预先计算的内核训练 SVM,afaik 我将不会总是具有与预测相同的输入数据(输入数据上的预先计算内核)的形状训练集?!