我有一个 5 分的李克特量表和互联网上的时间度量,例如 1= 少于 10 分钟,2=10-30 等以及 SNS 联系人的数量(1=10-30 等)。我想估计它们的相关性,但我认为我不能直接这样做。我计算了李克特反应的平均分数,但其他两个指标呢?
如何在李克特量表和有序分类测量之间建立相关性?
机器算法验证
相关性
序数数据
李克特
2022-04-19 06:31:04
2个回答
Kendall 的\之一呢?它们是有序数据的一种等级相关系数。
这是 Stata 和的示例。值表示完全负关联,表示完全一致。零表示没有关联。在这里,我们看到速度限制和事故之间存在适度但重要的负相关。
. webuse hiway, clear
(Minnesota Highway Data, 1973)
. tab spdlimit rate, taub
| Accident rate per million
Speed | vehicle miles
Limit | Below 4 4-7 Above 7 | Total
-----------+---------------------------------+----------
40 | 1 0 0 | 1
45 | 1 1 1 | 3
50 | 1 4 2 | 7
55 | 10 4 1 | 15
60 | 9 2 0 | 11
65 | 1 0 0 | 1
70 | 1 0 0 | 1
-----------+---------------------------------+----------
Total | 24 11 4 | 39
Kendall's tau-b = -0.4026 ASE = 0.116
您还可以尝试进行非对称修改,该修改仅纠正自变量的关系。这称为 Somer's D:
. somersd rate spdlimit
Somers' D with variable: rate
Transformation: Untransformed
Valid observations: 39
Symmetric 95% CI
------------------------------------------------------------------------------
| Jackknife
rate | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
spdlimit | -.4727723 .1395719 -3.39 0.001 -.7463282 -.1992163
------------------------------------------------------------------------------
所有这些关联度量都是相关的,因为它们将所有观察对(在我们的示例中为高速公路)分类为一致或不一致。(速度限制)的较大值的观测值也具有变量(事故率)的较大值,则一对是一致的。它们的数量比你可以动摇的要多(还有一个是 Goodman 和 Kruskal 的,它像一样完全忽略了关系)。它们通常会得出相似的结论,即使它们不能直接比较。
上述结果与 Greg 提到的 Spearman 等级相关系数定性一致(其绝对值往往大于):
.ci2 rate spdlimit, spearman
Confidence interval for Spearman's rank correlation
of rate and spdlimit, based on Fisher's transformation.
Correlation = -0.451 on 39 observations (95% CI: -0.671 to -0.158)
该度量不考虑对,但比较了如果您分别使用每个变量对观察进行排名,您将获得的排序的相似性(Stata 通过分配平均排名来打破平局,这只是排名上的 Pearson 相关性)。这使得计算速度更快,因为您不必考虑所有对。另一方面,中心极限定理对的工作速度要快得多,因此如果您打算进行推断,那么该度量可能会更好。是最常见的变体。
当两个度量都是序数时,Spearman 等级相关会产生可解释的相关度量。
其它你可能感兴趣的问题