拿一个数据集,假设我们为它拟合了两个分位数回归模型,一个带有原始因变量 (DV),一个带有记录的 DV。然后查看每个模型对训练数据的预测,在记录模型的情况下反转转换。这是R中的一个例子:
library(quantreg)
set.seed(1)
x1 = rnorm(100)
y = exp(x1 + 3*rnorm(100))
m = rq(y ~ x1, tau = .5)
p1 = predict(m)
m = rq(log(y) ~ x1, tau = .5)
p2 = exp(predict(m))
print(head(p1))
print(head(p2))
这两个模型给出了不同的预测:
1 2 3 4 5 6
0.4631787 0.8619277 0.3602179 1.5567692 0.9337257 0.3676802
1 2 3 4 5 6
0.2776789 0.7859069 0.2122640 4.8162168 0.9478212 0.2164372
但这怎么可能呢?这些模型根据 DV 的分位数进行拟合,自然对数是一个递增函数,因此它保留了分位数等级。