我想知道我是否正确理解了选择节点的过程,并想看看这个例子是否有意义。使用以下数据:
> df
Y A B C
1 1 0 1 1
2 0 0 0 1
3 1 1 1 0
4 1 0 1 0
5 1 1 0 1
6 1 0 0 1
我将拆分 A、B、C 上的数据并评估每个拆分的熵,其中熵是使用计算的
其中是特定拆分的成功比例。
当在 AI 上分裂时
Y A B C
3 1 1 1 0
5 1 1 0 1
和
Y A B C
1 1 0 1 1
2 0 0 0 1
4 1 0 1 0
6 1 0 0 1
对于(第一个数据表)我有,那么熵是 0。
对于(第二张表)我有和熵 0.81
所以对于分裂我会说熵是
然后以类似的方式对执行此操作。
对于我发现所以熵 = 1
对于,我发现所以熵 = 0.91
那么在上分裂的熵是
对于,我发现所以熵 = 0.81
对于我发现所以熵 = 0
那么在上分裂的熵是
鉴于上述具有最高熵的分裂是,因此我会选择首先在上分裂。
我现在有一个带有一个节点的决策树,并且需要为和的每个分支选择下一个节点。
以与上述相同的方式进行该选择。
上面的计算和推理是否有效?