深度强化学习的应用

数据挖掘 机器学习 深度学习 强化学习 卷积 卷积神经网络
2022-03-13 23:51:01

我是深度学习的新手,尤其是强化学习。我想知道是否有可能预测哪个主题标签组合(来自所选主题标签的子集)会为某个图像产生最多的喜欢。

是否有可能拥有一个以每个主题标签作为标签的卷积神经网络,并在类似强化学习的场景中将类似的东西reward = likes / followers作为奖励?

我还能以什么其他方式面对这个问题?我的目标不是预测喜欢的数量,而是最大化获得最多喜欢的概率。

我选择这个标题是因为我认为答案实际上可能与问题无关:我可以使用相同的知识来定义哪种股票组合可以最大化我的投资。

提前致谢。

1个回答

老实说,这听起来更像是一个监督学习问题。为了使强化学习发挥作用,您需要一个可以不断返回给定输入值的模型。

对于社交媒体,这意味着

  • a) 用各种不同的标签发布同一张图片,并期望人们在短时间内给出最合适的标签喜欢。这不会发生。

  • b) 搜索所有出现的具有不同主题标签的图像。这基本上是监督学习。

我建议先找到一个社交媒体数据集。尝试对图像的所有出现进行分组,并找到每个主题标签的喜欢的中位数。不要忘记补偿追随者数量,因为无论标签如何,更受欢迎的海报平均会获得更多喜欢。将最佳主题标签存储为给定图像的标签。

您现在为 X 个不同的图像设置了 Y 个不同的主题标签。

从现在开始,您可以将其视为分类问题。X 是您的样本数,Y 是可能输出的数量。如果您不想编写自己的损失函数而只想预测单个最佳主题标签,请使用交叉熵作为损失函数。

当然,您仍然必须选择您的社交媒体数据集、合适的训练图像和 NN 结构,但我希望这有助于作为一种通用方法。