将评级视为情绪标签?

数据挖掘 nlp 朴素贝叶斯分类器
2022-02-14 14:31:32

初学者在这里!

我有一个数据集,其中包含对产品的评论作为文本,对产品进行评分。

我之前的动机是使用朴素贝叶斯分类器进行情感分析。但我的数据没有所需的变量(情绪) - 负面/正面。

  1. 我应该使用评级(1-5)并将其编码为正面和负面吗?
  2. 还是使用基于词典的方法更有效?
1个回答

这将取决于任务的确切目标和数据集的细节,但总的来说,如果数据与任务相关,我会说最好使用数据专门提供的信息。在这种情况下,产品的评分确实很可能反映了文本的情绪,所以我会选择它。请注意,您也可以同时执行这两项操作,并比较预测情绪与评级得出的情绪不同的情况。

鉴于评分以 1-5 分的形式提供,我还会考虑将任务视为回归问题,而不是标准的二元分类设置。