我是推荐系统的新手,正在尝试为基于用户的协同过滤寻找基本用户的相似用户。
当我计算两个用户之间的相似度分数时(基于他们使用 Pearson 算法 [或 Resnick 的加权 Pearson 算法] 的评分),我得到了一个从 -1 到 1 的相似度分数。
将这些值标准化为 0 到 1(-1 将变为 0,1 将变为 1)以使其与其他算法具有可比性,这是一个好主意吗?
事实上,我试图用用户的负相似度得分来构建推荐,计算/预测的评分也可能是负的,这没有任何意义。
我应该将“-1 到 1”标准化/缩放为“0 到 1”还是切断所有相似度分数低于 0 的用户?
(也许问题也可能是:“哪些用户应该作为导师来推荐相似性分数从 -1 到 1 的新项目?或者我应该选择相似性分数最高的前 n 个用户?”)