用于提取特征的设计模式

数据挖掘 特征选择
2022-02-21 20:01:10

我正在寻找与提取特征的模块相关的设计模式。我想在我的数据点上定义一定数量的特征,然后根据性能和特征选择,我可能想删除其中一些并添加其他特征,并且我可能想考虑它们的任何子集进行测试.

有什么好的设计模式可以做到这一点?我错过了什么明显的东西吗?我既不是工程师也不是开发人员,所以我从不研究这些东西,但我知道它可以帮到我很多!

谢谢你的帮助,

1个回答

当我考虑如何在 OOP(如 Java)中实现某个 ML 或数据挖掘过程时,我通常会去看看比我更聪明的人如何设计他们的系统。在这种情况下,我会看看 Weka、RapidMiner、JAVA ML 或其他人如何决定解决这个问题。

在您选择功能/属性的情况下,我正在添加指向 Weka API 的链接。如果您想更好地了解它是如何完成的,您应该下载 Weka 并使用源代码。

http://weka.sourceforge.net/doc.dev/weka/classifiers/meta/AttributeSelectedClassifier.html

在不涉及具体实现的情况下,我认为任何类型的链表都可以解决问题,因为您想选择所有功能的子集。