我目前正在使用在大型语料库上预训练的 GloVe 嵌入矩阵。就我的目的而言,它可以正常工作,但是,它不知道一些单词(例如,单词“eSignature”)。这有点破坏了我的结果。我没有时间或数据在不同的(更特定于领域的)语料库上重新训练,所以我想知道是否可以基于现有向量添加向量。我用 E(word) 表示词的嵌入。下面的工作吗?
E(eSignature) = 1/2 * ( E(electronic) + E(signature) )
如果不是,我可以使用哪些其他想法在词嵌入中添加几个词?