NCF Recommender - 在模型输入中编码的目标,为什么它不容易过拟合?

数据挖掘 推荐系统
2022-03-07 14:19:46

在推荐系统NCF中,输入是一批用户-商品交互(单热编码),输出是商品是否被购买的 0-1 分数:

在此处输入图像描述

这似乎表明模型训练的项目输入向量已经包含 y。我理解这样做的目的,但这不会导致过度拟合的危险性高吗?

1个回答

系统的输入是一个给定的用户和一个给定的项目(每一个都分别单热编码)。系统的输出是二进制的(选择与否)。

作者过滤了数据,要求每个用户至少选择了 20 个不同的项目。因此,使系统能够了解用户的一般偏好。

系统可能会过拟合。系统可以记住用户只会挑选他们已经挑选过的物品。

系统将在选择的评估协议上失败 - 坚持最后一次交互。该模型在该评估协议上的表现优于其他推荐系统,这证明该系统没有过度拟合。