交叉验证的预测错误是 iid 吗?

机器算法验证 交叉验证 预言 错误 独立
2022-03-28 18:11:14

比如说,我们使用留一法交叉验证独立样本上测试任意回归或分类过程。这导致对每个样本的估计。nenn

可以假设这些是(可能未知的)分布的独立绘制吗?en

我的直觉说不因为(1)每个测试样本的训练集几乎相同,并且(2)样本用于训练和测试。

如果我的直觉是错误的,并且错误独立的,那么k折交叉验证呢,其中相同的训练集用于样本组?n/k


免责声明:我试图尽可能简明扼要地提出这个问题。如果它缺乏细节或特异性,请发表评论,我会相应地更新问题。

2个回答

我认为你需要清楚你需要代表什么分布。这根据交叉验证的用途而有所不同。

他们不能独立。考虑添加一个极端异常值样本,那么您的许多交叉验证折叠将以相关的方式倾斜。