除了预处理数据,探索性数据分析还能以何种方式帮助特征选择?比如说,如果对目标变量的每个预测变量进行双变量分析,如果可能的话,这对特征选择有什么帮助?
探索性数据分析和选择好的预测变量 ?
数据挖掘
特征选择
特征工程
预处理
2022-03-11 08:27:15
1个回答
这是一个有趣但广泛的问题。
想象一下 PCA。您将它用于探索嵌入在低维空间中的数据,但第一个主成分也用作特征(在对它们进行数据投影之后)。
或者您使用相关性分析并删除(取消选择)与现有特征具有高度相关性的特征。
你计算每个特征的方差 abd 低方差告诉你这个特征没有信息。
您根据目标检查特征分布以确定它们对预测的贡献程度。
当然还有更多...
其它你可能感兴趣的问题