当我们使用自顶向下的方法来归纳决策树时,我们需要使用某种分裂标准来选择某个内部节点的分裂特征和分裂值。
标准可以是:
- IG
- IGR
- 基尼杂质
但是特征选择似乎是计算量很大的。因为我们需要枚举所有现有特征并遍历其所有可能的拆分值。并且对于每个特征/分割值,我们需要计算标准值并记住它,并选择最佳值。
我对此是否正确?我们可以做些什么来改进它吗?
当我们使用自顶向下的方法来归纳决策树时,我们需要使用某种分裂标准来选择某个内部节点的分裂特征和分裂值。
标准可以是:
但是特征选择似乎是计算量很大的。因为我们需要枚举所有现有特征并遍历其所有可能的拆分值。并且对于每个特征/分割值,我们需要计算标准值并记住它,并选择最佳值。
我对此是否正确?我们可以做些什么来改进它吗?
我将分享我在实施这类决策树方面的经验。我在 R、Weka、Python 实现中也发现了一些想法。为了简单起见,我假设您谈论的是类似 CART 的树,但我解释的内容可以简单地扩展到任何类型的决策树。
PS:但是我相信这个问题更多地属于SO