我正在处理以下数据:
我正在尝试计算每个渠道的影响A_PDE, B_PDE, C_PDE, D_PDE。但是,由于Sales = 0对于大多数记录,并且我的模型预测这些记录的销售额非零,我的价值非常低。我怎样才能解决这个问题?我不认为从模型中删除零销售记录是正确的。
我正在处理以下数据:
我正在尝试计算每个渠道的影响A_PDE, B_PDE, C_PDE, D_PDE。但是,由于Sales = 0对于大多数记录,并且我的模型预测这些记录的销售额非零,我的价值非常低。我怎样才能解决这个问题?我不认为从模型中删除零销售记录是正确的。
基于降维的答案:您应该考虑降低数据集的维度。有多种方法可以降低数据集的维数
基于回归方法的答案:如果您真的想更准确地预测它们,另一种不降低维度的替代方法是使用加权最小二乘回归并在销售额上使用更高的权重。如果您的数据是高度非线性的,您还可以考虑使用非线性回归来捕捉模型的非线性。