Twitter 数据分析:我可以用这些数据做什么?

数据挖掘 nlp 数据清理 数据科学模型 主题模型 推特
2022-02-18 05:43:29

我从 Twitter 中检索到特定主题的数据,并对其进行了情绪分析。我从未在 NLP 等领域做过任何事情。那我还能做些什么呢?“主要目标”是查明 Twitter 社区是否反对这个“话题”。

我也在努力清理数据,我的意思是,我不确定我应该在这条推文上清理多少。

我也很乐意获得有关书籍、文章、社区、视频的任何建议......

1个回答

社区分析意味着图形分析。

这是您可以处理的事情的简短列表:

  1. 人们经常在某个社会群体之间转发推文。最小割法、Girvan-Newman 和模块化最大化是提取这些类型子结构的一些起始算法。
  2. 您可以尝试在共享特定主题的组中找到不同的层次结构
  3. 您可以尝试分析特定主题的推文的生命周期(生存分析)

分析推文更接近于图形分析而不是 NLP。这是关于社区分析的一个很好的概述有关编码和算法,请查看 graphX Spark 库如果您的数据不是太大,networkX 更容易对于生存分析,生命线是更容易的选择之一。