序数回归还是斯皮尔曼相关?

机器算法验证 回归 相关性 序数数据 群体差异
2022-03-22 16:49:22

我正在对两组不同的女性进行研究:一组是身材矮小的女性 (SSW),另一组是非身材矮小的女性 (NSW)。我们假设 SSW 对其当前体型 (CBS) 的自动感知不准确。我们用数字评级量表评估 CBS,包括 9 个不同的轮廓,范围从 1 到 9(这将评估从“营养不良”到“非常肥胖”之类的东西)。我们知道 CBS 很大程度上取决于人的体重指数 (BMI)。因此,我们想知道与 SSW 相比,BMI 是否是新南威尔士州 CBS 的一个明显更好的“预测指标”。

我的第一种方法是运行两个 Spearman rho 秩相关检验(每组(SSW 和 NSW)一个,在 BMI 和 CBS 之间),然后使用 Fisher 的 Z 检验比较两个系数。尽管如此,我很确定我可以将 CBS 视为一个序数变量,对吧?因此,在我看来,序数回归(使用 CBS 作为 DV,使用 BMI 作为 IV)更适合我的数据。如果这是真的,我的问题是我不知道如何比较序数回归的系数。会比较 Nagelkerke-R² 吗?我怎样才能做到这一点?

总而言之,我有两个主要问题:a)在这种情况下,Spearman rho 等级相关性与 Fisher Z 检验的系数比较是否足够?b)如果序数回归更充分,我如何比较两组之间的回归系数?

1个回答

是的,CBS 听起来很有序。如果您只对比较双变量关系感兴趣,比较 Spearman 的ρs 对我来说似乎很公平。但是,序数回归模型将允许您估计 BMI 和身高的独立关系,同时控制其他预测变量的影响。您还可以通过包含交互项来测试这些因素是否相互调节。有关这方面的更多信息,请参阅“如何检验回归系数是否由分组变量调节? ”和“检验系数之间显着差异的正确方法是什么?

后一个问题中描述的方法对于您在多元回归中的目的是正确的(尽管它不是在那个 OP 的情况下)。如果您想计算两个预测变量的斜率系数至少与您的样本中的差异一样多的概率,如果(1)您要从完全相同的总体中收集另一个等效样本,并且如果(2)您的预测变量实际上与 CBS 相关,那么您可以使用z测试来做到这一点:

Z=b1b2SEb12+SEb22

您可以使用in将生成的z统计量转换为概率pnorm或使用此处描述的其他方法:“如何处理大于 3 的 Z-score?

顺便说一句,如果您有连续的身高数据,您可能应该重新考虑将身高分为矮身高和非矮身高。这会浪费可以改进回归模型和相关性估计的信息;通过输入最初测量的 BMI 和身高数据(如果有的话)作为 CBS 的多重序数回归中的预测变量,您可能会得到更小的标准误差。