我已经构建了一个自动编码器,以从非常高维(200 维)的空间中提取更小但重要的表示(16 维)。
现在我有了这些“编码”向量,我想计算某种相似度得分或聚类。
我不确定在这一点上应用哪种距离概念。考虑到我使用了自动编码器,我有什么想法可以得到相似度/集群吗?
我已经构建了一个自动编码器,以从非常高维(200 维)的空间中提取更小但重要的表示(16 维)。
现在我有了这些“编码”向量,我想计算某种相似度得分或聚类。
我不确定在这一点上应用哪种距离概念。考虑到我使用了自动编码器,我有什么想法可以得到相似度/集群吗?
您可以计算要比较的两个编码向量之间的余弦相似度。两个向量之间的余弦相似度定义如下: