我不确定这个问题是否适合这个论坛,如果不适合,请原谅(如果不适合,任何关于哪里可能是更好的地方的建议将非常感激)。我目前是定量领域的本科生,今年夏天,我有机会在我工作的公司做一个数据项目。我不确定从哪里开始。我今天与一位企业主进行了交谈,以便更好地了解业务的运作方式以及他们拥有什么样的数据。我们谈到了他们有什么样的问题,以及什么样的事情会很高兴知道。我想这似乎是主要问题:要问什么问题?我最初的想法是首先通过传统的描述性统计方法(直方图、散点图等......)查看数据,也许这会产生一些想法。如果有人有一些提示,甚至是一些好的链接(是的,我已经用谷歌搜索了很多),我将不胜感激。谢谢。
分析公司数据的第一步
数据挖掘
数据
2022-02-19 18:38:07
2个回答
您需要尽可能完整地了解他们如何期望数据分析使他们能够实现目标。他们是一家企业,因此他们的总体目标可能与利润最大化有关。但是,在该标题下将有一个更直接的目标。为了最大化利润,您可以降低成本或增加销售额。反过来,为了增加销售额,您可以增加客户数量或增加对每个客户的销售额等。
然后问题转向了如何使用数据科学来执行这些目标。
例如,几乎可以用数据科学回答的问题可能是“我如何更好地识别潜在客户?” 或“如何增加现有客户的支出?” 这些仍然是非常高级的问题,但是当您开始进行描述性统计等时,您需要牢记这些问题。
请记住,这是一个迭代过程,从一个模糊的区域开始是完全正常的。在这个阶段,有一个问题几乎是麦高芬——它会开始,但它可能不是你最终回答的问题。
CRISP-DM 流程是为数据挖掘而构建的流程,它讨论如何迭代地使用分析和模型的结果来增加您对客户情况的理解,从而推动开发更好的业务目标以用于数据科学项目。
几周前我问了一个类似的问题,并得到了一些很好的反馈。我的问题的一个答案也来自 Robert de Graaf,这是链接: 给新数据科学家的提示
似乎首要任务通常只是从各种来源收集数据并对其进行清理。根据我有限的经验,我认为这是一个很好的起点,实际上可能需要相当多的时间。组织好数据后,继续进行数据可视化/探索将帮助您了解数据。Kaggle 有一些很好的数据可视化教程,如果我找到了,我会发布一个。
其它你可能感兴趣的问题