数据科学家和建模专业人士关心模型的稳定性是很正常的。这基本上意味着,如果一个变量在今天很重要,它就不能随着时间的推移而改变其重要性,因为这种不稳定性将证明模型的弱点。
很难说稳定性是好的。但是在信用建模领域(例如,产生信用评分),人们被稳定性破解了,以至于更喜欢歧视较少的模型而不是更稳定的模型。
我的问题是稳定性的真正效用是什么,以及用模型的歧视性指标(KS、Gini、AUC 等)进行权衡的正确方法是什么。
我猜测(个人猜测)稳定性以某种方式将模型与不太理想的指标联系起来,因为它不允许行为随时间变化。如果它们没有真正改变,就不会有问题,但如果变量的影响随着时间的推移而改变,通常会假设这反映在稳定性较低的情况下,分析师通过放置更简单的模型或删除变量。