数据挖掘 - 如何分析重复测量数据进行预测？ - 吾爱随笔录

在我的工作中，我们收集产品的销售数据。我们有一组与我们开展业务的一级客户（我们称该组为千斤顶）。然后这些千斤顶将我们的产品出售给最终客户（我们称该组为玫瑰）。

这些销售数据包含产品、产品类型、细分市场（如 APAC、EMEA 等）、请求数量（按千斤顶）、订购数量（按千斤顶）、成本价（我们对千斤顶的销售价格）、收入（我们的基于要求的数量和价格的预期收入），采购订单日期，售价（千斤顶售价为玫瑰）。

请注意，订单请求的变量在其自身之前被捕获（在初始协商期间），但只是附加到此 csv

现在，有了这些数据，我们的业务目标是增加我们的收入（这意味着千斤顶预订的订单数量（让他们把它卖给玫瑰）应该很高）。

但是，我们实时看到请求的订单数量和预订的订单数量之间存在巨大差异。

因此，如果我们可以提前预测订单预订数量，并且如果发现订单数量较少，我们可以确保我们不会过度生产或跟进千斤顶来下更多订单（或知道他们为什么不下订单的原因）预订足够的订单）。

我应该为此做线性回归吗？但我的数据包含重复测量。意思是，来自杰克组的客户可以出现多次。意思是，一旦他出售了产品 A，其中请求的订单和预订的订单类型匹配（差异较小），但同一客户会出售产品 B，其中请求的订单和预订的订单之间的差异非常大（影响我们的收入和不必要的积压我们的库存）。

线性回归可以用于重复测量吗？

如您所见，每个客户可能有也可能没有多条记录。那么，哪种算法更适合这种情况呢？

如果您认为这个问题必须以不同的方式提出，请告诉我