数据源问题

数据挖掘 数据挖掘 数据 初学者
2022-02-28 06:07:45

我正在做一个“分析”项目,我必须从南美的小企业 (SME) 收集数据,并尝试就他们的总体需求提出一些见解。该项目的教练基本上是想从社交媒体和商业协会网站上收集数据,并对其进行一些文本分析,看看我们是否可以获得一些见解。

理想情况下,该项目的想法是给定一个国家和一个行业,找出这些行业的公司在做什么,看看他们的问题是什么。

这就是我的想法:

  1. 在 twitter API 和 facebook API 中查找关键字。

  2. 查找有关给定国家/地区的 SME 的新闻并抓取内容。

  3. 查找协会网站。我反对这个,但这里的内容大部分时间都没用。

这个项目的目标是获得一些见解,看看是否可以为这些公司定制一些新产品。

因此,我的问题是:如果您没有任何数据,您将如何解决这样的问题?我还在考虑从这些公司的样本中获取一些联系信息,然后向他们发送调查或其他内容。

3个回答

世界银行开展的企业调查“提供全球最全面的新兴市场和发展中经济体公司层面的数据”。提供 135 个国家 130,000 家公司的商业数据。您可以根据一些保密条款在网站上请求访问。

这些数据相当全面,可以为您提供一个很好的起点来形成假设,即哪些领域(获得信贷、监管、腐败等)最重要,然后您可以尝试通过挖掘新闻或社交媒体进行测试。

世界银行还收集营商环境数据,这些数据虽然不针对小公司,但突出了国家特定的挑战。

围绕上述两个程序发表了大量研究。

你最好的选择是进行焦点小组或进行市场研究,这可能会非常昂贵。你不可能在 Twitter、Facebook 或新闻上找到任何有用的东西。再多的文本挖掘也无法解决您的问题。这不是您想听到的答案,但您的项目并不是为成功而设置的,您应该寻找/提出一个新项目,而不是可能在这个项目上浪费更多宝贵的时间。

我也会看学术文章,如果他们以前做过这样的分析或者他们有相关的数据。如果主题可能不相关,但您可以找到一些相关数据并与作者联系。