在庞大的数据集中找到最大值

计算科学 优化 算法 数据分析 数据集
2021-12-17 20:20:10

我正在做一个涉及一些模式识别的项目。为此,我需要在巨大的多维数据集中找到最大值。例如,我有一个包含 10^10 个数据点的离散 5 维空间当然,我可以进行详尽的搜索,但时间至关重要,所以我正在寻找一种时间(和内存)高效的算法来帮助我解决这个问题。可能类似于梯度下降。仅供参考,项目完成是Java。

1个回答

在不了解您的数据的情况下,不可能比详尽搜索做得更好。这将是内存高效的,但在时间上是线性的。

如果您的数据集不包含局部最小值,您可以简单地遵循最陡下降。然而,这仍然具有最坏情况下的线性时间。

一个可能更好的解决方案是下坡单纯形算法