调优后在训练过程中包含验证文件

数据挖掘 机器学习 训练 超参数调整
2022-03-12 14:45:58

完成调整过程后,我是否应该在训练过程中包含验证文件(例如使用验证文件搜索参数)?

1个回答

这取决于训练集、有效集和保持/测试集的分布。

有几种可能性(基本上是排列)。一般来说,任何不同的分布=协变量偏移都是不好的,你应该修复它。如果是这种情况,包括 valid 是您的问题中最少的(但您应该在这种情况下包括它以进行更正)并且您应该担心 covarite shift。

如果集合之间的分布相同,则不会产生任何负面差异,并且只有将有效超参数调整数据集添加到训练中才会有所帮助。