难以缩放逻辑回归的分数

数据挖掘 逻辑回归 计分
2022-02-25 13:29:50

我正在使用逻辑回归构建信用记分卡,类似于此处显示的。但是,当尝试将逻辑回归的系数转换为分数表示(通过使用提供的公式缩放值)时,我得到的数字没有多大意义。

用于计算分数的公式:

Score_i= (βi × WoE_i + α/n) × Factor + Offset/n

  • 其中βi是逻辑回归的系数(变量i),

  • WoE_i对应变量的证据权重,

  • α是逻辑回归的截距,

  • 因子计算为PDO / ln(2),

  • 偏移量计算为target_points - (factor * ln(target_odds))

  • n是回归中使用的变量数

在我的例子中,PDO = 50,target_odds = 2,target_points = 500,n = 81,截距为 -0.12686514。

这是我的一项功能的示例:

示例 1

可以看出,随着“收入”变量的增加,WoE 和系数的值都会增加。然而,乐谱不会以这种方式发挥作用。最初我只是假设分数与这两个值成反比,所以我在公式前面添加了一个负号:

Score_i= -(βi × WoE_i + α/n) × Factor + Offset/n

但对于其他一些特征,分数与其他值成正比:

在此处输入图像描述

现在添加负号会使此功能的分数没有多大意义。

如何保持缩放一致?我在这里做错了什么?

1个回答

原来我使用了错误的公式来缩放分数。公式

Score_i= (βi × WoE_i + α/n) × Factor + Offset/n

只有在进行 WoE 变换后进行逻辑回归时才适用,这意味着对于所有特征(不是所有箱!)分配一个 WoE 值,然后分类器是合适的。

我这样做的方式是先分箱,然后将带有虚拟值的列输入分类器。

参考正确方法