我已经为具有 1200 个变量的 10K 观测值的大型数据集运行了 LASSO / Cox 模型。
fit <- glmnet( x, Surv(time, status), alpha=1, family='cox')
cv.fit <- cv.glmnet(x, Surv(time, status), alpha=1, family='cox')
CV后模型选取了56个系数非零的变量,有的系数为负值,有的系数为正值。我想知道我们是否就变量系数值的重要性发表了一些看法?
对于负值的系数和正值的系数,我们能说什么?
Some Variables and its Coefficients Values
CSI_SUPPORT -2.51E-19
Power.Glass.Moonroof 0.046261522
FLOOR_PLAN_SUPPORT -0.005169085
R.Design.Nubuck.Off.Black 0.254841459
TOTAL_AMOUNT -6.19E-05
K36100 -0.062819229
K36100 -0.237663697
Textile.Off.Black.seats 0.159802697
Design.Leather.Black -0.401298769
MARKETING_SUPPORT -0.000182012