可以对同一变量进行二叉决策树中的两个或多个拆分吗?

机器算法验证 大车
2022-04-15 06:48:44

我的问题是关于二元决策树(二进制到整数)。

如果在同一个变量ex.上定义的条件有什么问题吗?x1 ? 我的意思是当我为我的树定义变量时,我可以选择:

if(x1>3)
then  
   if (x1>4)
   then ....
   else
    ....
    end
else
....
end 

如您所见,我的变量始终为 x1,但条件不同。在我在网上找到的所有二元决策树中,变量都会发生变化!

1个回答

是的,这是可能的并且经常发生。考虑本教程的第 4 页树,您将看到对变量longitudelatitude进行了多次拆分。在 CART 算法的每一步中,所有的预测器都被尝试过,最好的一个(选择用于拆分的那个)是最大化分区杂质(或其他度量)减少的那个,就是这样。然后你取你的子节点并再次拆分它们。然后你迭代。绝对没有什么可以排除对同一预测变量的重复拆分。

教程的完整链接:http: //www.stat.cmu.edu/~cshalizi/350/lectures/22/lecture-22.pdf