如何选择递归特征消除参数

数据挖掘 降维 模型选择 射频
2022-02-16 20:23:09

在我的项目中,我有 >900 个特征,我想使用递归特征消除算法来降低我的问题的维度(以提高准确性)。

但我不知道如何选择 RFE 参数(估计器和要选择的参数数量)。

在这种情况下我是否也应该使用模型选择技术?你有什么建议吗?

1个回答

实际上,特征选择有两种选择:

  • 任意和/或基于外部约束选择特征数量和其他参数。通常仅根据 RAM 内存可以处理的内容以及训练过程可能需要多长时间来选择这些参数。
  • 运行完整的超参数调整过程:通过在每种情况下训练模型来尝试许多不同的值,然后在测试集上进行评估或使用交叉验证。在过程结束时,选择实现高性能的参数,重新训练最终模型,然后在不同的(新)测试集上进行评估。

不用说,第二种选择需要更多的时间和/或计算能力。请记住,一旦使用不同的参数进行了多次试验,理论上这需要一个新的测试集进行最终评估。