我正在阅读 Andrew Ng 的决策树笔记。它有一个部分解释了使用决策树对分类变量的用法,其中我无法理解这一部分
” 上面的一个警告是,我们必须注意不要让一个变量有太多的类别。对于一组类别 S,我们可能的问题集是幂集 P(S),基数为 2^|S | 。因此,大量的类别使得问题选择在计算上变得难以处理。”
Q1 -> 可能的问题集如何是?它应该等于决策树中的非叶节点。
链接到关于决策树的 Andrew Ng 笔记:http: //cs229.stanford.edu/notes/cs229-notes-dt.pdf
你能澄清一下吗?