我一直在努力处理随机森林中的分类变量,以进行二元分类。在这个教学视频的 8:15 到 9:30 之间,它谈到了一个“聪明的把戏”。
它说这个技巧可以在统计学习元素 “技巧”中找到,以处理随机森林中二元分类的分类变量。但是,当我阅读关于随机森林的部分时,我似乎找不到这个“聪明的把戏”!有人可以暗示正确的部分在哪里,还是我遗漏了一些明显的东西?谢谢你。
编辑:
我阅读了第9.2.4 节:其他问题 - 分类预测器,谢谢。但是,这句话对我来说不清楚:
“我们根据结果类别 1 中的比例对预测类别进行排序。 ”
“比例”是指:
该类中 1 与该区域中示例总数的比率或该类中 1 与该类中示例数的比率?
后者可能会被倾斜的数据抛出。假设有一个只有一个例子的类恰好是 1。根据“比例”的后一个定义,这意味着该类将排名第一,因为它的比例是 1。哪个比例定义是正确的?