为什么 Spearman 的等级相关范围从 -1 到 1

机器算法验证 数理统计 相关性 斯皮尔曼罗 排名
2022-03-27 07:43:39

ρ=16di2n(n21)

ρ = Spearman 等级相关系数 = 每个观察的两个等级之间的差异 = 观察数
di
n

鉴于上述 Spearman 等级相关性,可以清楚地看到最大值为 1,因为最小的将为零。我试图通过以完全相反的顺序排列两个等级来弄清楚为什么它是-1。di

我在下面附上我的计算,其中红色矩形代表四行的特定情况,我以完全相反的顺序排列了两个等级。紫色矩形是实际的计算结果,它确实是-1。我尝试在绿色矩形中进行概括,但该公式如何导致 2? 在此处输入图像描述

2个回答

有关定义,请参见维基百科请注意,Spearman 相关性只是通常的 Pearson 相关性,但使用数据的等级而不是数据本身计算。

所以它总是在区间中的原因与 Pearson 相关的证明相同。通过使用 Cauchy-Schwartz 不等式。[1,1]

正如您所注意到的,总和包括为简单起见,我将研究存在偶数行的情况,即当为偶数时。12+32+52++(m1)21m/2(2r1)2m

您可以通过将括号扩展为来扩展总和,并使用标准公式计算总和:

1m/2(2r1)2=4r24r+1
1nr2=16n(n+1)(2n+1)1nr=12n(n+1)

这给出了

46(m/2)((m/2)+1)(m+1)42m/2(m/2+1)+m/2=16(m3m).

我们现在可以将其代入您的表达式:

6(21m/2(2r1)2)m3m
=6(216(m3m)m3m
=2(m3m)m3m
=2

所以斯皮尔曼等级系数是-1

所以在这种情况下,可以直接计算该值。您可能不熟悉标准公式。通常它们通过归纳来证明,但在数学 StackExchange 上提供了视觉证明:https ://math.stackexchange.com/questions/122546/gaussian-proof-for-the-sum-of-squares