我正在训练一个具有 5 倍分层交叉验证的 CNN。在第一次折叠时,我的准确率约为 80%,在随后的每一次折叠中,准确率约为 50%。最后,在拟合整个训练集后,我的准确率回升到 ~80%。我可以看到,在表现不佳的折叠中,准确性和损失永远不会真正改变。仅仅是一个折叠接收到来自数据集的所有/大部分信号,还是这里发生了其他事情?
交叉验证分数的巨大变化
数据挖掘
深度学习
美国有线电视新闻网
交叉验证
2022-03-16 02:40:26
1个回答
根据描述,我的猜测是出现以下任何或所有问题:
- 数据不是随机的,这可以解释为什么第一个折叠的性能与其他折叠非常不同
- 也许数据集非常小,导致性能和过度拟合的巨大变化。
- 在任何情况下,模型都非常不稳定,可能是由于模型太复杂和/或数据集太小而导致的过度拟合。