是否有任何通用方法来近似缺失特征将如何影响回归模型的预测性能?
例如,如果我使用 10 个特征训练一个模型,但想在之后只提供这 10 个特征中的 8 个进行预测 - 简单地估算缺失值 - 那(统计上)如何影响我的目标指标。您也可以将其视为预测的某种信心下降。
我想知道是否有一些方法,比如从特征重要性中推导/估计性能的恶化,或类似的。不过,我没有找到任何相关的资源,到目前为止我自己也想不出一些有意义的想法。
是否有任何通用方法来近似缺失特征将如何影响回归模型的预测性能?
例如,如果我使用 10 个特征训练一个模型,但想在之后只提供这 10 个特征中的 8 个进行预测 - 简单地估算缺失值 - 那(统计上)如何影响我的目标指标。您也可以将其视为预测的某种信心下降。
我想知道是否有一些方法,比如从特征重要性中推导/估计性能的恶化,或类似的。不过,我没有找到任何相关的资源,到目前为止我自己也想不出一些有意义的想法。
我会单独删除每个功能,看看它如何影响我的测试集的性能。没必要花里胡哨。