我应该研究什么来找到机器学习中最佳特征组合的最佳值?

数据挖掘 机器学习 优化 遗传算法
2022-02-26 21:00:06

我想通过机器学习和/或优化问题进行生产优化。

我的目标不是找到最小化损失函数的损失,只是为了给出最好的 y 值。我的最终目标是找到最佳特征组合的最优值。换句话说,'我想找到产生最佳 y(最小化损失)的最佳 x 值(特征值)。例如,30(温度)、100(压力)、50(重量)给出了最好的产品 y。x 特征值的实际最佳集合。

监督机器学习技术无法为我提供最佳预测的 x 值。但我想找到x。因此,我的问题如下:

  1. 找到最优 y 值的最优 x 值的领域是什么?连续和离散优化是找到 y 的 x 值吗?

  2. 我发现了很多研究,但我不确定它是否真的是关于找到 x 值(最佳特征组合的最佳值)。有人可以告诉我我必须为此学习什么领域吗?

  3. 我应该使用什么样的技术来找到我想要的东西?

1个回答

欢迎来到 DS.SE!

正如您已经提到的,机器学习并不是要找到有关功能的最佳特征值。此外,损失函数通常测量预测的错误而不是特征值的质量(例如“最佳产品 y”)。

您正在寻找的是所谓的优化搜索算法,而不是学习或预测。如果搜索空间(即所有可能的特征值的组合)不是那么大,您可以执行穷举搜索(尝试所有组合)。如果搜索空间很大,那么更聪明的方法可能会很有用。这些技术需要一个函数(通常称为目标函数)来优化(找到导致最小/最大结果的输入值的组合)。

一般来说,有两种方法:数学建模(即线性规划)和元启发式(例如进化算法群体智能)。当目标函数定义明确并且满足基本假设时(有时您可能需要简化约束),数学模型可以快速并保证找到最优值。如果不满足这些条件,那么元启发式通常可以找到一组近似解。