数据挖掘 - 如果是监督学习，word2vec模型中的x变量和y变量是什么 - 吾爱随笔录

数据挖掘深度学习 word2vec nlp

2022-02-20 15:28:46

如果是监督学习，word2vec 模型中的 x 变量和 y 变量是什么。在这两种口味中 - CBOW 和 skip-gram 模型。

尽管一些博客将其解释为无监督学习。

谢谢

1个回答

首先，我将其称为自我监督，因为您不需要人工标签，但仍然需要标签让 NN 学习。

CBOW 和 skip-gram 都“组合”到 word2vec 中，但它们是浅层神经网络架构（尽管不同）。

由于它们是不同的架构，它们做不同的事情：

CBOW学习通过上下文来预测单词。或者通过查看上下文来最大化目标词的概率。

skip-gram模型旨在预测上下文，因此在给定单词 xyz 的情况下，它必须理解它并告诉我们上下文 abc__dfg 很有可能是 xyz 的“周围”。

鉴于此，您可以尝试自己推断输入和输出数据应该是什么样子，以对 CBOW、skip-gram（单词的矩阵表示和概率以及表示单词和多类输出的向量）的这种期望输入输出进行建模。

还要检查这个答案

其它你可能感兴趣的问题