特征交互与特征重要性
数据挖掘
特征工程
不同之处
特征交互
特征重要性
2022-02-21 13:07:06
1个回答
解释它的最直观的方法是我在这个Nature 上找到的:Explainable AI for Trees: From Local Explanations to Global Understanding:
特征重要性:特征对最终预测的贡献。如果是线性回归,这将是系数。对于决策树,您的意思是准确性降低,或者如论文所述,shapley 值。来自shapley github
特征交互:模型基于两个特征进行预测,我们可以将预测分解为四个项:常数项、第一个特征项、第二个特征项和两个特征之间的交互项。两个特征之间的交互作用是在考虑个体特征效应后通过改变特征而发生的预测变化。
假设我们的模型是这样的:
y = a + b·x_1 + c·x_2 + d·x_1·x_2
特征重要性项将是 b 和 c。
特征交互将是乘积 x_1 · x_2
所以一个是系数,另一个是两者之间的关系。在下图中,您可以看到 Age 增加值时 Age 和 Sex 之间的关系发生变化。
其它你可能感兴趣的问题

