“离线训练模型”和“预训练模型”有什么区别?

数据挖掘 机器学习 深度学习 计算机视觉 图像识别
2022-03-07 23:09:29

我很困惑两者是否相同,然后我该如何区分在线培训模型。

2个回答

每个预训练的模型都是离线训练的模型,但不是相反。

离线训练是在新的观察到达时保持模型不变的任何训练,即它有一个结束。在线训练在不使用先前训练点的情况下,借助新的传入观察不断更新模型,尽管与所有看到的样本相比,对先前样本的记忆有限是可以的。因此,在所有训练点上定期离线训练,无论多么频繁,都与在线训练不同。

  • 我们可以将离线训练用于支持在线训练的模型,但是,要在线训练,模型必须允许这样的训练。例如,如果不重新使用先前的训练点,就无法在 N 个新数据点上训练 SVM 的常见实现。相比之下,贝叶斯模型是在线学习的自然候选者,因为它们是通过根据新观察更新信念(模型)来训练的,即后验更新。

预训练是离线训练,然后是主要的、特定于任务的训练,因此前缀为“pre”。

例如,一个512×512×3128降维模型在大型 RGB 图像数据集(监督或自监督)上进行预训练。然后,使用预训练模型将我们的 [新] 图像的维度降低到128,然后将其馈送到特定于任务的主要模型。

请注意,“自我监督”(由输入本身监督)一词目前用于尝试重建或预测输入的整体或部分尽可能接近的模型;例如,自动编码器,或一些语言模型,如Word2Vec

在此处输入图像描述

在线模型:

在生产中不断学习的模型。如果有 10 个新的训练样本可用,我们不需要用所有以前的样本重新训练。

预训练模型

模型已经在大型数据集上进行过训练。这是一种通过迁移学习的有用技术。

https://www.slideshare.net/queirozfcom/online-machine-learning-introduction-and-examples

https://www.analyticsvidhya.com/blog/2015/01/introduction-online-machine-learning-simplified-2/

https://en.wikipedia.org/wiki/Online_machine_learning