我发现的 stackexchange 上的每个线程都说您只能使用测试集一次,仅此而已。因此,例如,如果您使用线性回归模型并且在测试集上得到了较差的结果,则您不能将模型更改为随机森林并在测试集上再次评估该模型。
这对我来说没有意义。例如,我们都非常了解 MNIST 数据集。假设我下载数据并将其拆分为训练、验证和测试。另外,假设我使用了线性回归模型,显然我在测试集上的表现会很差。现在,是什么阻止其他人下载相同的 MNIST 数据集、拆分为训练、验证、测试以及使用不同的模型(例如神经网络)并报告他们的测试结果?
根据我们只能使用一次测试集的理解,他们的测试结果是无效的,因为他们以某种方式“了解到”线性回归模型不好。这对我来说似乎不对。