我应用 lasso 回归进行变量选择,并在 10 个变量中选择了 4 个变量。
fit.lasso=glmnet(x,y,alpha=1)
plot(fit.lasso,xvar="lambda",label=TRUE)
cv.lasso=cv.glmnet(x,y)
coef(cv.lasso)
假设在这个命令之后,我们得到了 4 个具有非零系数值的变量,即:x1、x2、x3、x4。
然后,我使用了这个命令:
fit = lm( y~x1+x2+x3+x4)
并检查 x1, x2, x3, x4 对应的 p 值。那么如果 x3 的 p 值 > 0.05,我是否需要在最终模型中将其移除?
或者,使用 Coef(CV.lasso) 我们得到用于预测 y 的系数值?
和提示?
我正在使用 R