我的问题是关于二元决策树(二进制到整数)。
如果在同一个变量ex.上定义的条件有什么问题吗?x1 ? 我的意思是当我为我的树定义变量时,我可以选择:
if(x1>3)
then
if (x1>4)
then ....
else
....
end
else
....
end
如您所见,我的变量始终为 x1,但条件不同。在我在网上找到的所有二元决策树中,变量都会发生变化!
我的问题是关于二元决策树(二进制到整数)。
如果在同一个变量ex.上定义的条件有什么问题吗?x1 ? 我的意思是当我为我的树定义变量时,我可以选择:
if(x1>3)
then
if (x1>4)
then ....
else
....
end
else
....
end
如您所见,我的变量始终为 x1,但条件不同。在我在网上找到的所有二元决策树中,变量都会发生变化!
是的,这是可能的并且经常发生。考虑本教程的第 4 页树,您将看到对变量longitude和latitude进行了多次拆分。在 CART 算法的每一步中,所有的预测器都被尝试过,最好的一个(选择用于拆分的那个)是最大化分区杂质(或其他度量)减少的那个,就是这样。然后你取你的子节点并再次拆分它们。然后你迭代。绝对没有什么可以排除对同一预测变量的重复拆分。
教程的完整链接:http: //www.stat.cmu.edu/~cshalizi/350/lectures/22/lecture-22.pdf