我正在做一个涉及一些模式识别的项目。为此,我需要在巨大的多维数据集中找到最大值。例如,我有一个包含 10^10 个数据点的离散 5 维空间。当然,我可以进行详尽的搜索,但时间至关重要,所以我正在寻找一种时间(和内存)高效的算法来帮助我解决这个问题。可能类似于梯度下降。仅供参考,项目完成是Java。
在庞大的数据集中找到最大值
计算科学
优化
算法
数据分析
数据集
2021-12-17 20:20:10
1个回答
在不了解您的数据的情况下,不可能比详尽搜索做得更好。这将是内存高效的,但在时间上是线性的。
如果您的数据集不包含局部最小值,您可以简单地遵循最陡下降。然而,这仍然具有最坏情况下的线性时间。
一个可能更好的解决方案是下坡单纯形算法
其它你可能感兴趣的问题