是否可以使用深度学习编写程序,根据特定主题将文章(新闻、娱乐等)分类为正面类别或负面类别?
使用深度学习对文章进行分类
数据挖掘
机器学习
Python
数据挖掘
2022-02-19 07:01:20
1个回答
是的,这是经典的情绪分析。您需要训练数据才能编写此程序。
通常,人们会使用文章、推文、帖子等中的文本数据来构建语言模型。大多数人使用具有长短期记忆的递归神经网络来指定语言模型。这是一篇博客文章,其中包含链接到他们的 github 的代码。
在深入研究更高级的深度神经网络(如 LSTM)之前,从使用n-gram的多层感知器开始可能会更容易。
看起来你可能会要求一些不同的东西。所以,让我非常明确。我上面列出的模型将文章和将文章评估为正面或负面情绪的标签作为输入,然后该模型返回给定文章是正面或负面情绪的可能性。它绝不会返回主题。
要返回“主题”,最好的办法是运行Latent Dirichlet Allocation,然后返回从先前学习的给定主题生成给定文章的可能性。重要的是要注意,这些将仅来自从以前的训练数据中学习的主题,而不是新主题。
有可用于可视化主题模型(例如LDAVis)和语言模型嵌入(例如word2vec 可视化)的标准算法。
值得注意的是,在联合学习这些项目(即潜在主题和好/坏分类)方面正在进行研究。我建议查看这篇论文。
在实际应用它们之前,可能值得更彻底地审查这些项目。听起来你可能对你的目标是什么以及深度学习可以如何帮助你没有一个完整的了解。