根据我对模型堆叠的理解:元估计器训练结合 N 模型预测以适应基本事实。一旦经过训练,它就会结合第一级输出来接近基本事实。
元估计器是一个类型的模型:
因此组合仅基于第一级预测的值。但是,堆叠数据的每一行还链接到其他属性:“品牌”、“型号”、“功率”。为什么我们不利用这些属性来确定最佳组合?因此,如果品牌为“NaN”时模型 1 是最好的,元数据将学习它并将每个具有 NaN 品牌的预测重定向到模型 1。
所以我提出的元估计器如下: 品牌为空
- 这种方法存在吗?
- 如果没有,这是一个好主意还是坏主意?
根据我对模型堆叠的理解:元估计器训练结合 N 模型预测以适应基本事实。一旦经过训练,它就会结合第一级输出来接近基本事实。
元估计器是一个类型的模型:
因此组合仅基于第一级预测的值。但是,堆叠数据的每一行还链接到其他属性:“品牌”、“型号”、“功率”。为什么我们不利用这些属性来确定最佳组合?因此,如果品牌为“NaN”时模型 1 是最好的,元数据将学习它并将每个具有 NaN 品牌的预测重定向到模型 1。
所以我提出的元估计器如下: 品牌为空
堆叠学习者的基本原理是结合各个学习者的优势。
总结一下:堆叠方法依赖于元模型的“使事情变得简单”,因此它只需要调用单个学习者的答案。这样,元模型可以“专注”于优化使用这些答案。我们添加的功能越多,它无法正常工作的风险就越大。