尝试在这里学习,所以如果我问了愚蠢的问题,请放轻松。
正如标题所说,我正在寻找一个在 CART 算法中为三值特征变量计算 Gini 的教程。(即,假设我们有一个名为“血压”的特征变量,它具有三个级别(低、中和高))。然而,我一个也没找到。一个完美的例子是打网球问题,我们可以使用熵方法得到解决方案,但不能使用 Gini 方法。
尝试在这里学习,所以如果我问了愚蠢的问题,请放轻松。
正如标题所说,我正在寻找一个在 CART 算法中为三值特征变量计算 Gini 的教程。(即,假设我们有一个名为“血压”的特征变量,它具有三个级别(低、中和高))。然而,我一个也没找到。一个完美的例子是打网球问题,我们可以使用熵方法得到解决方案,但不能使用 Gini 方法。
没有类别,您将这些列编码为整数列并照常进行。基尼只是为了帮助您决定如何以及在何处拆分。Gini、Entropy、variance 都是可替换的组件。