假设我们有一个在数据集 A 上训练的模型,它像往常一样具有许多特征。然后,我们将该模型保存到磁盘并在需要运行推理(进行预测)时使用它。通常我们对具有相同特征的不可见数据进行推理。是否可以对具有不同特征的不可见数据进行推理。请注意,这些新功能与训练中使用的功能非常相似。所以从某种意义上说,这将是一种迁移学习(实际上更像是“迁移推理”)。这可以在 scikit learn 中完成吗,因为加载的模型(比如 Pickle)期望列名是相同的?
是否可以使用预训练的 scikit 学习模型对具有不同特征的数据集进行预测(与训练期间使用的特征不同)
数据挖掘
scikit-学习
迁移学习
2022-03-15 05:44:20
1个回答
从技术上讲,唯一的限制是特征数量必须与训练阶段相同(在大多数 scikit 学习模型中)。
它会表现良好吗?
我想说这真的取决于您使用的模型/方法的类型以及背后的原因:
请注意,这些新功能与训练中使用的功能非常相似
一般来说,除非训练特征和新特征以您的模型可接受的方式相关,否则它可能不会表现良好。
其它你可能感兴趣的问题