在 KLT 跟踪器中解释逆 Hessian 矩阵的特征值

信息处理 计算机视觉
2021-12-19 08:51:44

我是一名硕士生,正在准备一个计算机视觉研讨会。其中的主题是 Kanade-Lucas-Tomasi (KLT) 跟踪器,如在

J. Shi, C. Tomasi,“可追踪的好特征”诉讼 CVPR '94。

这是我用来了解 KLT 跟踪器的网络资源。我需要一些数学方面的帮助,因为我对线性代数有点生疏,并且没有计算机视觉方面的经验。

的这个公式中(摘要中的第 5 步),请注意逆 Hessian:Δp

Δp=H1Σx[IWp]T[T(x)I(W(x;p))]

在本文中,要跟踪的良好特征被定义为逆 Hessian 矩阵的总和具有大的、相似的特征值:从数学上讲,我无法理解这是如何以及从哪里得出的。min(λ1,λ2)>threshold

直觉是这代表一个角落;明白了。这与特征值有什么关系?我希望如果 Hessian 的值很低,则没有变化,也不是角落。如果它们很高,那就是一个角落。有谁知道角落的直觉如何在逆 Hessian 的特征值中发挥作用,以确定KLT 跟踪器迭代中的Δp

我已经能够找到声称 Hessian 逆矩阵与图像协方差矩阵相关的资源。此外,图像协方差表示强度变化,然后它是有道理的......但我一直无法找到关于图像的图像协方差矩阵到底是什么,而不是矢量或图像集合。

此外,特征值在主成分分析中具有意义,这就是为什么我想到图像协方差矩阵的原因,但我不确定如何将其应用于 Hessian,因为它通常应用于图像。据我所知,Hessian 是一个矩阵,定义了在某个位置的二阶导数。2×2xyxy(x,y)

我非常感谢您的帮助,因为我已经使用了 3 天以上,这只是一个小公式,时间不多了。

1个回答

将它们视为 2D 平滑项。
补丁越平滑,矩阵秩越低,矩阵越接近奇异。

在直边(不是拐角)上,只有一个特征值会很大。
在角落里,两者都会很大。

使用特征值意味着边缘的角度不是一个因素,并且在任何角度,边缘都会给出一个大的 ev