我已经使用余弦相似度构建了一个推荐引擎。当我想查找与数据集中已经存在的给定记录相似的所有记录时,它可以工作。考虑一个案例,用户输入一条相似度矩阵中不存在的新记录,为了找到并推荐相似的记录,我将新数据点添加到构建相似度矩阵的数据集中,然后选择相似的记录,有没有更好的处理这个问题的方法?
添加更多细节
data=["document1", "document2", "document", ... "documentN"]
count_matrix = count.fit_transform(data)
cosine_sim = cosine_similarity(count_matrix, count_matrix)