在我的工作中,我们收集产品的销售数据。我们有一组与我们开展业务的一级客户(我们称该组为千斤顶)。然后这些千斤顶将我们的产品出售给最终客户(我们称该组为玫瑰)。
这些销售数据包含产品、产品类型、细分市场(如 APAC、EMEA 等)、请求数量(按千斤顶)、订购数量(按千斤顶)、成本价(我们对千斤顶的销售价格)、收入(我们的基于要求的数量和价格的预期收入),采购订单日期,售价(千斤顶售价为玫瑰)。
请注意,订单请求的变量在其自身之前被捕获(在初始协商期间),但只是附加到此 csv
现在,有了这些数据,我们的业务目标是增加我们的收入(这意味着千斤顶预订的订单数量(让他们把它卖给玫瑰)应该很高)。
但是,我们实时看到请求的订单数量和预订的订单数量之间存在巨大差异。
因此,如果我们可以提前预测订单预订数量,并且如果发现订单数量较少,我们可以确保我们不会过度生产或跟进千斤顶来下更多订单(或知道他们为什么不下订单的原因)预订足够的订单)。
我应该为此做线性回归吗?但我的数据包含重复测量。意思是,来自杰克组的客户可以出现多次。意思是,一旦他出售了产品 A,其中请求的订单和预订的订单类型匹配(差异较小),但同一客户会出售产品 B,其中请求的订单和预订的订单之间的差异非常大(影响我们的收入和不必要的积压我们的库存)。
线性回归可以用于重复测量吗?
如您所见,每个客户可能有也可能没有多条记录。那么,哪种算法更适合这种情况呢?
如果您认为这个问题必须以不同的方式提出,请告诉我