加权线性回归 R

机器算法验证 r 回归
2022-04-22 05:37:31

谁能简单地向我解释当我们在 R 中regsubsetslmR 中使用权重时会发生什么?权重对线性回归有什么影响?例如 :

Model1<-lm(Ozone~Solar.R,data=airquality)
summary(Model1)
#Coefficients:
#            Estimate Std. Error t value Pr(>|t|)    
#(Intercept) 18.59873    6.74790   2.756 0.006856 ** 
#Solar.R      0.12717    0.03278   3.880 0.000179 ***
Model1<-lm(Ozone~Solar.R,data=airquality,weights=(2*seq(nrow(airquality),1,-1)))
summary(Model1)
#Coefficients:
#            Estimate Std. Error t value Pr(>|t|)    
#(Intercept) 18.57106    6.26067   2.966 0.003704 ** 
#Solar.R      0.10824    0.02927   3.699 0.000341 ***

请解释截距和斜率的变化。

2个回答

普通最小二乘法使残差平方和最小化(残差 = 测量值 - 拟合值)。加权最小二乘法对平方残差进行加权。来自help("lm")

加权最小二乘法与权重一起使用weights(即最小化 sum(w*e^2))

简单来说,这意味着为每个数据点分配一个权重,该权重增加或减少该数据点对最终模型的影响。因此,不使用原始数据的斜率和截距变化,而是使用加权数据。

如果您想了解更详细的信息,我建议您使用 stats.stackexchange.com这个论坛实际上只是针对编程问题,而不是统计问题(除非两者广泛融合)。