从理论上讲,我们可以在机器学习模型上实施修复种子,以在每次运行(可重现)时获得相同的结果,但这可能会导致偏差。所以,为了防止偏差,我会在不修复种子/状态的情况下多次运行模型。我应该运行机器学习模型多少次或通常由研究人员完成多少次才能得到结果(10 次运行,20.. 或更多)?
我们应该在机器学习模型上运行多少次?
数据挖掘
机器学习
分类
机器学习模型
集成建模
艾
2022-03-05 05:32:16
1个回答
这取决于您的问题,从一个大数字(32?)开始,然后在模型稳定/处理稳定性时减少。
您需要知道,多次运行可能是解决方案的一部分:您可以创建模型集合以获得更稳定的模型。同样,创建集成的方式和构建集成所需运行的模型数量是通过实验确定的。增加模型稳定性的主要替代方法是槽正则化(这实际上取决于您要使用的模型)。
其它你可能感兴趣的问题