对于组 #1 和组 #2 之间的常见用户列表,具有 n 个百分位等级向量:n
例如 vec1 = {0.25, 0.1, 0.8, 0.75, 0.5, 0.6} vec2 = {0.35, 0.2, 0.6, 0.45, 0.2, 0.9}
百分位等级代表组内的活动频率,例如开放时间。目标是根据这些常见用户的排名找到组#1 和组#2..n 之间的相似性。
到目前为止采取的方向是使用点积来考虑幅度(由于排名)。问题是标量答案可以取任何值,因此无法绘制阈值。
我是否需要针对 vec #1(第 1 组)与自身的点积绘制阈值?还是有另一种设置阈值的方法(可能是动态的)?

