信息处理 - 使用 GMM 进行图像分类的低识别率 - 吾爱随笔录

信息处理图片物体识别分类

2022-02-01 22:51:00

我想使用 GMM 进行图像分类。因此，我从语料库中的每个图像中提取了SIFT特征。然后，我应用 EM 算法来学习GMM参数（我已经在 matlab 中对其进行了编码）。当我在大量类 (>=4)上测试模型时，我对看不见的图像的识别率非常低。谁能解释一下这个结果？谢谢。

3个回答

您是否尝试使用 GMM 对 SIFT 描述符的分布进行建模？您使用的是实际的 128 元素描述符吗？如果是这样，那么您正在尝试对 128 维空间中的分布进行建模，这不太可能正常工作。

你需要降低维度。如果您坚持使用 GMM，那么最简单的尝试就是使用主成分分析 (PCA) 来降低描述符的维数。我不会使用超过 10 个维度。这是一篇论文，其中尝试了对简化的 SIFT 描述符进行核密度估计。

或者，您可以尝试其他算法，例如Bag Of Features或 Pyramid Match Kernel。

Andrew Moore 教授积极使用高斯混合模型和期望最大化来找到 GMM 参数。他可能可以通过他的电子邮件地址联系到他。

无监督学习的一般问题是它通常需要非常大的数据集。否则它将开始根据“不太重要”的特征而不是更重要的特征对图像进行分类。

此外，减少通过 SIFT 获得的特征数量可能会使您的模型明显更好。这可以通过预处理图像来完成：

1）裁剪不太重要的部分。

2）平滑图像。

3）减少颜色范围/二值化图像。

但是，必须注意做这些事情。

总而言之，我发现图像的无监督分类结果“差”和“不可靠”。

根据发布的答案，我将尝试在模型过程中添加以下步骤：

再次感谢您的帮助

其它你可能感兴趣的问题