我不太熟悉您何时以及为什么会在回归分析中对一个变量或一组变量进行分层,并且想知道与包含变量(单独或作为交互项)相比的问题是什么在没有分层的模型中。
我对 Cox 回归中的示例有些熟悉,在该示例中,当基线风险函数在变量的各个级别上不同时,您可以进行分层,变量是离散的,并且您不在乎是否对其进行了估计。在这种情况下,分层可能比包含与时间项的交互更可取。但我从未在其他回归环境中真正考虑过它。我错过了什么,我需要注意什么?
另外,我只是在谈论事物的分析方面,而不是在设计阶段或抽样阶段。如果这有助于缩小焦点,我只会对尚未从分层样本或设计中获取的观察数据进行二次分析。
还有一个具体的问题——我真的会检查模型中的每个预测变量是否进行分层吗?我了解到,如果您没有先验理由并且它们不是主要兴趣,则您不一定会检查交互。谢谢。