如何从二元分类器构造逻辑回归列线图?

数据挖掘 机器学习 逻辑回归
2022-02-21 20:38:00

我一直在阅读一些科学著作,但我不明白如何从逻辑回归模型构建列线图。在文章中:

开发和验证使用全血细胞计数参数预测 COVID-19 疾病严重程度的早期评分系统

来源-> https://pubmed.ncbi.nlm.nih.gov/34786318/

我还提供了从我的 Google Drive 下载的链接 -> https://drive.google.com/file/d/1xEoYh6RZJ3bsqdaCbfE943E11xFtgmeP/view?usp=sharing

在文章中,他们使用描述两个目标值的 COVID19 数据集。患者死于新冠病毒或幸存下来。除了预处理阶段和特征选择以及统计特征,他们选择了 10 个血液参数,算法将在这些参数上进行训练和评估。[嗯,不仅仅是血,因为年龄也在这里] 经过训练,结果证明逻辑回归模型的结果最好,因此选择它来创建列线图。在此处输入图像描述

所以..逻辑回归模型被用来创建列线图来预测covid19死亡率。
在此处输入图像描述 如果分数 < 0.05,则死亡概率低。如果得分 > 0.5,则概率很高。

我无法理解的一点是他们是如何得出死亡概率 的,这是:

在此处输入图像描述

我得到了所有关于预处理、特征选择和统计特性的部分。

1个回答

数学很简单:

Step 1: Lets Assume your Logistics equation is
 log(p/(1-p) = BO + B1X + B2X + B3X

Step 2: Exponentiate and take the multiplicative inverse of both sides    
 (1-p)/p = 1/ exp(BO + B1X + B2X + B3X. )

Step 3: Partial out the fraction on the left-hand side of the equation and add one to both sides


 1/p = 1 + 1/ exp(BO + B1X + B2X + B3X )

Step 4: Take the sum on RHS

 1/p = (exp(BO + B1X + B2X + B3X ) + 1)/exp(BO + B1X + B2X + B3X )

Step 5: Finally, take the multiplicative inverse again to obtain the formula for the probability p(y=1):
 p = exp(BO + B1X + B2X + B3X ) / (1+exp(BO + B1X + B2X + B3X ))

计算概率的公式是:
概率 = exp(BO + B1X + B2X + B3X ) / (1+exp(BO + B1X + B2X + B3X ))

如果你用这个代替你的方程,你可以得到死亡的概率,假设目标变量中的死亡为 1