当一篇论文在数据集上报告模型的平均值和标准时,这意味着他们已经改变了训练集和测试集的拆分并多次运行该模型,或者他们只是多次运行该模型以不断拆分以找到随机性模型?哪个更常见?
运行多次模型是为了模型随机性还是数据随机性?
数据挖掘
训练
2022-02-15 13:09:28
1个回答
通常,我们报告 k 折交叉验证和类似技术的均值和方差。我们在不同的数据中多次运行模型,但这也可以应用于第二种情况,例如,可以使用随机权重多次初始化神经网络以在模型中进行测试。
如果论文没有明确说明他们重新拆分了数据集,那么这种差异更有可能来自随机初始化。您应该阅读使用的实验程序并尝试确定论文结果的所有方差来源。
所以它可能是数据集随机拆分和模型随机初始化中的一个或两者的组合