如何在李克特量表和有序分类测量之间建立相关性?

机器算法验证 相关性 序数数据 李克特
2022-04-19 06:31:04

我有一个 5 分的李克特量表和互联网上的时间度量,例如 1= 少于 10 分钟,2=10-30 等以及 SNS 联系人的数量(1=10-30 等)。我想估计它们的相关性,但我认为我不能直接这样做。我计算了李克特反应的平均分数,但其他两个指标呢?

2个回答

Kendall 的\τ之一呢?它们是有序数据的一种等级相关系数。

这是 Stata 和的示例。表示完全负关联,表示完全一致。零表示没有关联。在这里,我们看到速度限制和事故之间存在适度但重要的负相关。τb1+1

. webuse hiway, clear
(Minnesota Highway Data, 1973)

. tab spdlimit rate, taub

           |    Accident rate per million
     Speed |          vehicle miles
     Limit |   Below 4        4-7    Above 7 |     Total
-----------+---------------------------------+----------
        40 |         1          0          0 |         1 
        45 |         1          1          1 |         3 
        50 |         1          4          2 |         7 
        55 |        10          4          1 |        15 
        60 |         9          2          0 |        11 
        65 |         1          0          0 |         1 
        70 |         1          0          0 |         1 
-----------+---------------------------------+----------
     Total |        24         11          4 |        39 

          Kendall's tau-b =  -0.4026  ASE = 0.116

您还可以尝试进行非对称修改,该修改仅纠正自变量的关系。这称为 Somer's D:τb

. somersd rate spdlimit
Somers' D with variable: rate
Transformation: Untransformed
Valid observations: 39

Symmetric 95% CI
------------------------------------------------------------------------------
             |              Jackknife
        rate |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
    spdlimit |  -.4727723   .1395719    -3.39   0.001    -.7463282   -.1992163
------------------------------------------------------------------------------

所有这些关联度量都是相关的,因为它们将所有观察对(在我们的示例中为高速公路)分类为一致或不一致。(速度限制)的较大值的观测值也具有变量(事故率)的较大值,则一对是一致的。它们的数量比你可以动摇的要多(还有一个是 Goodman 和 Kruskal 的,它像一样完全忽略了关系)。它们通常会得出相似的结论,即使它们不能直接比较。 XYγτa

上述结果与 Greg 提到的 Spearman 等级相关系数定性一致(其绝对值往往大于):τ

.ci2 rate spdlimit, spearman

Confidence interval for Spearman's rank correlation 
of rate and spdlimit, based on Fisher's transformation.
Correlation = -0.451 on 39 observations (95% CI: -0.671 to -0.158)

该度量不考虑对,但比较了如果您分别使用每个变量对观察进行排名,您将获得的排序的相似性(Stata 通过分配平均排名来打破平局,这只是排名上的 Pearson 相关性)。这使得计算速度更快,因为您不必考虑所有对。另一方面,中心极限定理对的工作速度要快得多,因此如果您打算进行推断,那么该度量可能会更好。是最常见的变体。n(n1)2ττb

当两个度量都是序数时,Spearman 等级相关会产生可解释的相关度量。