使用 iid 时间序列的 SuperLearner 交叉验证

数据挖掘 交叉验证 采样
2022-02-11 22:36:16

我在 R 中创建了许多 ML 模型,我的目标是将它们组合成一个整体。

我了解了 SuperLearner 库,它交叉验证了许多模型并将权重返回给集成中的每个模型。

然而,交叉验证机制从整个训练集中随机抽取观察值。这带来的问题是,在回归模型中,如果 y 不是独立同分布(金融时间序列中的典型值),那么这种抽样方法会引入偏差。

有没有办法将交叉验证集设置为训练集中连续观察的 x%,以便考虑序列自相关?

0个回答
没有发现任何回复~