我们有分布式数据中心,我们在每个数据中心构建决策树。我们的问题是将我们的 CART 决策树组合成一个 CART 决策树。每个数据中心中与同一事件相关的数据(例如来自光传感器的数据)。我知道提升方法,但它们没有给出我们想要的结果。
有没有已知的方法可以做到这一点?
我们有分布式数据中心,我们在每个数据中心构建决策树。我们的问题是将我们的 CART 决策树组合成一个 CART 决策树。每个数据中心中与同一事件相关的数据(例如来自光传感器的数据)。我知道提升方法,但它们没有给出我们想要的结果。
有没有已知的方法可以做到这一点?
你提到了两个决策树。遍历决策树非常便宜,因此通过多棵树运行特征实例非常快,您可以从数据中心获取所有决策树并对结果进行平均,也许可以通过模型的(交叉验证)强度来衡量它。随机森林是强大的模型,它也以这种方式组合决策树,除了它们是在特征的随机子集上完成的(在某些情况下也是数据的随机子集)。