我有一套英语圣经中的 10 节经文。我想检测文本中任何这些经文的出现。这样做的最佳方法是什么?
请注意,圣经的经文从一个翻译到另一个的措辞不同。例如,诗句“把你所有的焦虑都推给他,因为他关心你”在其他翻译中存在如下:
KJV 把你所有的关心都倾注在他身上;因为他关心你。
ESV 把你所有的焦虑都投给了他,因为他关心你。
NLT 把你所有的忧虑和关心交给上帝,因为他关心你。
此外,人们在写诗时可能会出现拼写错误或错误。
你会说语义搜索是最好的方法吗?如果是这样,我是否使用相关的词嵌入模型,在我的 10 节经文上重新训练它,然后在我的文本中搜索这些经文的出现?
搜索机制将如何工作?我是否逐句获取单词嵌入,并将每个句子的嵌入与我的 10 节经文嵌入的圣经语料库逐一进行比较?
