探索性数据分析和选择好的预测变量 ?

数据挖掘 特征选择 特征工程 预处理
2022-03-11 08:27:15

除了预处理数据,探索性数据分析还能以何种方式帮助特征选择?比如说,如果对目标变量的每个预测变量进行双变量分析,如果可能的话,这对特征选择有什么帮助?

1个回答

这是一个有趣但广泛的问题。

想象一下 PCA。您将它用于探索嵌入在低维空间中的数据,但第一个n主成分也用作特征(在对它们进行数据投影之后)。

或者您使用相关性分析并删除(取消选择)与现有特征具有高度相关性的特征。

你计算每个特征的方差 abd 低方差告诉你这个特征没有信息。

您根据目标检查特征分布以确定它们对预测的贡献程度。

当然还有更多...