机器算法验证 - 从 R 中的 Firth 逻辑回归预测概率 - 吾爱随笔录

从 R 中的 Firth 逻辑回归预测概率

机器算法验证 r 物流

2022-03-29 08:35:05

我正在使用logistfR 中的包对不平衡的数据集执行 Firth 逻辑回归。我有一个logistf对象：

fit = logistf(a~b)

类中是否有predict()类似 on 的函数lm来预测未来数据点的概率？或者我是否必须手动输入来自 Firth 回归的估计参数。

2个回答

另一种方法是brglm包。例如，使用与@chl's Answer 相同的数据/模型

data(sex2)
fm <- case ~ age + oc + vic + vicl + vis + dia
fit <- brglm(fm, data = sex2)

predict(fit, newdata = sex2[1:5, ], type = "response")

这会产生

> predict(fit, newdata = sex2[1:5, ], type = "response")
        1         2         3         4         5 
0.3389307 0.9159945 0.9159945 0.9159945 0.9159945

请注意，在这种brglm()情况下，由于函数的工作方式，您在上面看到的只是predict.glm()R 中标准函数/方法的结果。

您可能可以用很少的代数计算任何您想要的预测。让我们考虑示例数据集，

data(sex2)
fm <- case ~ age+oc+vic+vicl+vis+dia
fit <- logistf(fm, data=sex2)

一旦我们得到回归系数，设计矩阵是计算预测概率的唯一缺失部分，由下式给出

betas <- coef(fit)

因此，让我们首先尝试对观察到的数据进行预测：

X <- model.matrix(fm, data=sex2)       # add a column of 1's to sex2[,-1]
pi.obs <- 1 / (1 + exp(-X %*% betas))  # in case there's an offset, δ, it 
                                       # should be subtracted as exp(-Xβ - δ)

我们可以检查我们是否得到了正确的结果

> pi.obs[1:5]
[1] 0.3389307 0.9159945 0.9159945 0.9159945 0.9159945
> fit$predict[1:5]
[1] 0.3389307 0.9159945 0.9159945 0.9159945 0.9159945

现在，您可以在上面的设计矩阵中放入X您感兴趣的值。例如，将所有协变量设置为 1

new.x <- c(1, rep(1, 6))
1 / (1 + exp(-new.x %*% betas))

我们得到个体概率为 0.804，而当所有协变量都设置为 0 ( new.x <- c(1, rep(0, 6))) 时，估计概率为 0.530。

其它你可能感兴趣的问题

上一篇R中回归或方差分析公式中的运算符的含义是什么下一篇贝叶斯先验对应于惩罚回归系数