有人可以直观地解释为什么尺度空间域中的局部最大值和最小值会产生好的关键点吗?
我理解使用 LoG 或 DoG 零交叉点来识别空间变化,即角落。而且我了解在不同的尺度上工作以找到尺度不变的特征。这两个都非常直观。
但是我看不到局部极值是什么使它们成为各种算法(如 SIFT)的良好特性。
有人可以直观地解释为什么尺度空间域中的局部最大值和最小值会产生好的关键点吗?
我理解使用 LoG 或 DoG 零交叉点来识别空间变化,即角落。而且我了解在不同的尺度上工作以找到尺度不变的特征。这两个都非常直观。
但是我看不到局部极值是什么使它们成为各种算法(如 SIFT)的良好特性。
LoG 和 DoG(LoG 的近似值)掩码可以用作斑点检测器。一个斑点可以存在于图像中的多个位置 -坐标和比例尺(一些参数;)。在某些情况下,尺度空间被分成 3 个离散的“切片”并且只有“小”、“中”和“大”大小的 blob,“中等”大小的 blob 将对“小”和“小”有一些响应。大型探测器。然而,尺度与斑点尺度匹配的检测器将具有最大的响应。出于这个原因,我们希望通过确定空间和尺度坐标中的最大响应来定位 blob。
关键点最重要的特征之一是它在不同几何变换和光照下的可重复性。可重复性可确保,例如,如果您有两个相同场景的图像,大小不同且旋转角度也不同,则两个图像中的绝大多数关键点将重合,通过这种方式,您可以制作一个两者之间的“匹配”。在 SIFT 算法中,这些关键点对平移、旋转和缩放是不变的;对于每个关键点,使用 128 个分量的梯度直方图对邻域进行编码(半径与 DOG 算子的比例成正比),这样每个关键点 (x, y) 将关联一个由 128 个分量组成的向量,这矢量被称为“描述符”。这有什么用处?
对象识别:给定一组不同对象的图像,可以为每个图像存储一组描述符。当测试图像到达时,它的描述符被提取并与存储的描述符进行比较。为此,通常使用 noma-L2 或分类稀疏表示。
SIFT 在高斯差分空间中寻找局部极值。这基本上相当于对图像进行带通滤波,然后寻找极值以识别潜在的关键点。强边缘可以在该域中创建极值,因此您可以将其视为一种边缘检测技术。