我有一个数据集,其中一些项目已被标记(分为 4 类 [A、B、C、D])。但是,绝大多数数据集尚未标记。我的假设是,有一些特征会影响将哪个类别应用于每个项目。聚类甚至推荐系统是否能够建议每个项目的放置位置?在实际层面上,我会在模型中提供“标签”吗?或者我会将它分开直到最后,然后将这些标签覆盖在模型设法组合在一起的任何东西上?
上面的例子看起来像是一个集群用例。但是,我可以将问题转入推荐系统吗?如,您将项目 X 标记为 A,它具有特征 1,2,3...项目 Y 具有相似的特征,也许您也应该将其标记为 A?