我试图使用这个项目:
https://github.com/UKPLab/sentence-transformers
对于嵌入非英语句子,该语言不是人类语言,它的机器语言(x86)
但问题是我找不到一个简单的例子,它显示了我如何使用自定义数据集嵌入句子而没有任何标签或句子的相似性值。
基本上我有一个句子列表数组,没有任何句子标签或它们的相似值,我想将它们嵌入向量中,以尽可能最好的方式保留句子的语义,到目前为止我已经使用了 word2vec 和doc2vec 使用 gensim 库,所以我想尝试这种方法,看看它是否更好?