我想使用 GMM 进行图像分类。因此,我从语料库中的每个图像中提取了SIFT特征。然后,我应用 EM 算法来学习GMM参数(我已经在 matlab 中对其进行了编码)。当我在大量类 (>=4)上测试模型时,我对看不见的图像的识别率非常低。谁能解释一下这个结果?谢谢。
使用 GMM 进行图像分类的低识别率
信息处理
图片
物体识别
分类
2022-02-01 22:51:00
3个回答
您是否尝试使用 GMM 对 SIFT 描述符的分布进行建模?您使用的是实际的 128 元素描述符吗?如果是这样,那么您正在尝试对 128 维空间中的分布进行建模,这不太可能正常工作。
你需要降低维度。如果您坚持使用 GMM,那么最简单的尝试就是使用主成分分析 (PCA) 来降低描述符的维数。我不会使用超过 10 个维度。这是一篇论文,其中尝试了对简化的 SIFT 描述符进行核密度估计。
或者,您可以尝试其他算法,例如Bag Of Features或 Pyramid Match Kernel。
Andrew Moore 教授积极使用高斯混合模型和期望最大化来找到 GMM 参数。他可能可以通过他的电子邮件地址联系到他。
无监督学习的一般问题是它通常需要非常大的数据集。否则它将开始根据“不太重要”的特征而不是更重要的特征对图像进行分类。
此外,减少通过 SIFT 获得的特征数量可能会使您的模型明显更好。这可以通过预处理图像来完成:
1)裁剪不太重要的部分。
2)平滑图像。
3)减少颜色范围/二值化图像。
但是,必须注意做这些事情。
总而言之,我发现图像的无监督分类结果“差”和“不可靠”。
根据发布的答案,我将尝试在模型过程中添加以下步骤:
- 在应用 SIFT 之前对语料库中的图像进行预处理步骤
- 应用 SIFT 后对图像进行后处理步骤,以便 PCA 减少特征的维度
再次感谢您的帮助
其它你可能感兴趣的问题