转换 Y(因)变量后解释系数

数据挖掘 机器学习 线性回归
2022-03-12 22:41:24

我一直在研究用于预测目的的线性回归。

我有一个模型,我在其中使用了 BoxCox 转换Y变量(销售)与λ=0.3. 模型如下:

Y=130.2X1+3X2

给定转换,我如何解释每个变量的销售效果?

例如,假设X1=5X2=0.3然后我们得到:

Y=130.2×5+3×0.3=12.9

12.9 的反向 BoxCox 与λ=0.3是 196。所以它预测 196 的销售额。但是如果我们增加X2从 0.3 到 1 并增加X1从 5 到 10 然后我们得到:

Y=130.2×10+3×1=14

然后反向 BoxCox 给出 244 个销售预测销售额。增加了48个销售额。但其中有多少取决于X1X2?

如果我们分别计算它们,答案不会相加!

编辑:为了明确上述观点:

如果X1从 5 到 10 但是X2不变:

Y=130.2×10+3×0.3=11.9,转换为 159 销售。从起始位置减少 -37 (196-159)

然而,如果X2从 0.3 到 1 但是X1不变: Y=130.2×5+3×1=15,转换为 294 销售额。销售额增加了 +98 (294-196)。

但如果X2销售额增加了 98 和X1减少 37 的销售额,当您同时包含这两项更改时,您预计净增长为 +61。但从早些时候我们发现,通过应用这两者,我们实际上获得了 +48 的销售额增长!

我们如何才能计算出导致变化的实际销售变化X1X2?

1个回答

通过对 Y 变量使用 BoxCox 变换,您可以将模型从线性回归转变为非线性回归。请注意,尽管您似乎正在训练线性回归,但它仅相对于 Y 的转换版本是线性的,但对于原始 Y 是非线性的。因此,您不能期望非线性模型具有线性行为,这意味着您可以未计算出导致 X1 和 X2 变化的实际销售额变化。这是因为与线性模型不同,在非线性模型中 f(x+b) 不等于 f(x) + f(b)