决策树分类器中的数值范围

数据挖掘 机器学习
2022-02-18 01:39:23

决策树分类器是否适用于数值范围?

在此示例数据集中。

数据集

我计划测试有关以下年龄范围的数据:

  • 18-25
  • 26-30
  • 31-40
  • 41岁及以上

使用这些员工的绩效得分,决策树是否能够使用年龄范围做出决策?该计划的目标是通过使用以下数字数据来确定影响该员工年龄范围的因素:教育和 # 年 Exp。

所以输出将是(在这里使用基尼指数)

  • 年龄| 基于年龄范围的影响因素。
  • 18-25 教育 25%
  • 25-30 #Of Years 到期 9.50%

是否可以通过基于年龄范围和性能分数来训练算法?

1个回答

是的,但必须使用数字范围的正确表示:这是一个序数变量,即它有顺序但不是连续的。常见的选项有:

  • 范围可以表示为一个简单的整数:第一个范围为 1,第二个范围为 2,以此类推。
  • 或者它可以用代表范围的值来表示,例如范围的中间。