将相似图像聚类到文件夹中

数据挖掘 聚类 图像分类
2022-03-05 19:15:43

我不知道在哪里问这个问题,如果这个问题看起来不合适,请原谅我(请指导我在哪里问!)

我有一个 9GAG 图像的存档,我想根据它们的内容和相似性对它们进行聚类...... 9GAG 图像主要是模因,所以很自然你会发现它们中的许多彼此非常相似......

我找不到任何开箱即用的应用程序(如果有,请您给我介绍一下吗?),我发现了大量关于图像聚类的论文,但没有基于它们的真正应用程序。 .

我想知道是否有一个 Ruby、Python 或 Java 程序可以简单地获取图像的目录并根据它们彼此的相似性将它们聚类成组(文件夹)?

非常感谢你...

3个回答

如果已经有专用的 9gag 集群,我会印象深刻:P

但是,您可以阅读这篇关于Python 中图像的层次聚类的博文,这与您想要的很接近。问题是作者使用图像的平均颜色作为特征,它可能被证明是粗略的而不是低效的。你可能会发现一些更有趣的东西可以使用。但最后,您需要对自己的数据集进行大量实验。

从每个图像中提取颜色直方图。然后用 ELKI 对它们进行聚类,ELKI 具有许多图像相关的相似性度量,例如直方图相交距离。也许先从层次聚类开始,然后再尝试 OPTICS。

我想分类在这里是一个更好的术语。一种想法是计算图像的直方图。从直方图中制作 32 个 bin。因此,如果图像具有红、蓝、绿通道,每个通道有 256 个值,您将得到一个 32*3=96 维的向量。您可以在其上运行 SVM 或朴素贝叶斯。