为什么没有关于计算三值分类特征变量中基尼杂质的教程?

数据挖掘 机器学习 决策树
2022-03-06 15:11:17

尝试在这里学习,所以如果我问了愚蠢的问题,请放轻松。

正如标题所说,我正在寻找一个在 CART 算法中为三值特征变量计算 Gini 的教程。(即,假设我们有一个名为“血压”的特征变量,它具有三个级别(低、中和高))。然而,我一个也没找到。一个完美的例子是打网球问题,我们可以使用熵方法得到解决方案,但不能使用 Gini 方法。

1个回答

没有类别,您将这些列编码为整数列并照常进行。基尼只是为了帮助您决定如何以及在何处拆分。Gini、Entropy、variance 都是可替换的组件。