最终模型中的 XGBoost “yes=3,no=4”是什么意思?

数据挖掘 xgboost
2022-02-15 16:42:47

XGBoost v0.6 二进制分类

$ cat predin.txt 
0 1:10 2:10 3:10
1 1:10 2:10 3:100
1 1:10 2:100 3:10
1 1:100 2:10 3:10

换句话说,负实例标签 0 需要所有三个特征的低值。

./xgboost/xgboost m.conf
./xgboost/xgboost m.conf task=dump model_in=0002.model name_dump=dump.raw.txt
$ cat dump.raw.txt 
booster[0]:
0:[f1<55] yes=1,no=2,missing=1
    1:[f2<55] yes=3,no=4,missing=3
        3:[f3<55] yes=5,no=6,missing=5
            5:leaf=-1.5
            6:leaf=1.5
        4:leaf=1.5
    2:leaf=1.5
booster[1]:
0:[f1<55] yes=1,no=2,missing=1
    1:[f2<55] yes=3,no=4,missing=3
        3:[f3<55] yes=5,no=6,missing=5
            5:leaf=-0.784694
            6:leaf=0.784694
        4:leaf=0.784694
    2:leaf=0.784694

“是=3,否=4”是什么意思?

1个回答

我认为它应该如下所示:

  • 如果条件为真,则转到分支 3
  • 否则转到分支 4

我只是猜测,但似乎有道理