海灵格距离值的限制

数据挖掘 机器学习 Python 数据挖掘 文本挖掘 距离
2022-03-06 11:21:17

我正在计算不同向量的 Hellinger 距离。我最初假设它返回的值在 0 到 1 的范围内。

然而,对于以下两个向量,我收到的 Hellinger 得分1.0488088481701514> 1

vector_1 = [0.0,0.5,0.7]
vector_2 = [1.0,0.0,0.0]

现在,我很想知道 Hellinger 距离值的范围。请解释我为什么该值超过 1。

1个回答

它以统一为界,但您的第一个向量不编码概率质量函数,因为 0.5 + 0.7 > 1.0。如果 0.7 为 0.5 或 0.5 为 0.3,则距离将为 1.0,因为分布被最大程度地分开,没有重叠。