验证数据 NN 的目的

数据挖掘 神经网络
2022-02-13 01:09:39

除了使用验证数据来调整超参数之外,将验证数据包含到模型中还有其他好处吗?

我所读到的只是它被用来调整超参数和检查过拟合。检查过拟合是否与调整超参数分开?

训练:调整参数(权重和偏差) 验证:调整超参数 测试:评估模型

那么,如果我们不调整超参数,验证集就没有意义了吗?

1个回答

验证集的整个想法是模型不知道这些数据,因此您可以获得模型性能的无偏估计。然后根据这种无偏估计,您可以找到模型的最佳参数。问题是,找到超参数本身就是训练模型的一种方式。因此,通过优化超参数,模型开始过度拟合验证集。这就是为什么要检查模型的真实准确性,您实际上需要数据的不同部分,而您的模型从未见过。这是数据的测试部分。

因此,在您的情况下,当您没有任何超参数时,您可以在训练和测试中使用除法。

如果您想要更高的准确度来估计模型的准确度,那么最好使用交叉验证,而不是仅仅在训练和测试上进行划分。神经网络通常不进行完全交叉验证,因为这意味着将计算时间增加数倍(5 次用于 5 倍交叉验证)。

使用超参数,理想的方法是进行双重交叉验证。一个用于验证集,一个用于测试集。这在计算上太昂贵了,所以它只用于非常简单的模型,比如岭回归。

据我所知,很少有模型没有超参数。通常那些没有超参数的性能不如那些有的。岭回归通常优于线性回归。具有可变层数的神经网络比全自动神经网络表现更好。