我在 R 中创建了许多 ML 模型,我的目标是将它们组合成一个整体。
我了解了 SuperLearner 库,它交叉验证了许多模型并将权重返回给集成中的每个模型。
然而,交叉验证机制从整个训练集中随机抽取观察值。这带来的问题是,在回归模型中,如果 y 不是独立同分布(金融时间序列中的典型值),那么这种抽样方法会引入偏差。
有没有办法将交叉验证集设置为训练集中连续观察的 x%,以便考虑序列自相关?
我在 R 中创建了许多 ML 模型,我的目标是将它们组合成一个整体。
我了解了 SuperLearner 库,它交叉验证了许多模型并将权重返回给集成中的每个模型。
然而,交叉验证机制从整个训练集中随机抽取观察值。这带来的问题是,在回归模型中,如果 y 不是独立同分布(金融时间序列中的典型值),那么这种抽样方法会引入偏差。
有没有办法将交叉验证集设置为训练集中连续观察的 x%,以便考虑序列自相关?