我有一个包含大约 10,000 个特征的数据集。这些特征具有它们固有的层次结构。我发现了一种执行特征工程的算法,考虑了特征的层次结构。该过程之后,特征空间将被改变,原始特征可能不存在。该算法将特征数量减少到大约 2000 个特征。作为下一步,我计划使用自动编码器(执行降维)并获得潜在表示来执行分类任务。我没有将原始数据集用于自动编码器的原因是我想为我的模型使用有关特征层次结构的信息。这是一个有意义的模型吗?两次压缩特征空间没有意义吗?谢谢!
我们可以同时使用特征选择和降维吗?
数据挖掘
深度学习
特征选择
自动编码器
降维
2022-03-02 06:45:47
1个回答
每次压缩特征空间时,都会丢失一些信息。您概述的原始特征工程阶段听起来像是有意义的压缩,并且在您的问题的上下文中可能是有意义的。另一方面,第二次压缩可能只会丢失一些信息。
如果您正在训练的分类器在初始压缩后正在努力训练您的模型,我只会执行第二次压缩。在这种情况下,您可能希望牺牲一些信息来更快地训练模型。但是只有在您尝试仅使用原始压缩来训练您的模型并且对训练速度不满意之后,才应该调查此步骤。
祝你好运!
其它你可能感兴趣的问题