我正在查看 mtcars 数据集并探索 MPG 和传输模式(自动/手动)之间的关系。我决定将以下线性模型与以下 R 代码中指定的回归量一起使用:
> data(mtcars)
> fit <- lm(mpg ~ I(wt - mean(wt)) + I(qsec - mean(qsec)) + factor(am), data = mtcars)
> round(summary(fit)$coeff, 4)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 18.8979 0.7194 26.2707 0.0000
I(wt - mean(wt)) -3.9165 0.7112 -5.5069 0.0000
I(qsec - mean(qsec)) 1.2259 0.2887 4.2467 0.0002
factor(am)1 2.9358 1.4109 2.0808 0.0467
综上所述,斜率系数“factor(am)1”的 P 值低于 0.05,因此我们拒绝原假设并推断手动变速箱汽车的 MPG 值高于手动变速箱汽车。
但是,我也尝试探索没有截距项的等效线性模型,如下面的 R 代码:
> fit2 <- lm(mpg ~ I(wt - mean(wt)) + I(qsec - mean(qsec)) + factor(am)-1, data=mtcars)
> round(summary(fit2)$coeff, 4)
Estimate Std. Error t value Pr(>|t|)
I(wt - mean(wt)) -3.9165 0.7112 -5.5069 0e+00
I(qsec - mean(qsec)) 1.2259 0.2887 4.2467 2e-04
factor(am)0 18.8979 0.7194 26.2707 0e+00
factor(am)1 21.8338 0.9438 23.1344 0e+00
> confint(fit2)
2.5 % 97.5 %
I(wt - mean(wt)) -5.3733342 -2.459673
I(qsec - mean(qsec)) 0.6345732 1.817199
factor(am)0 17.4244109 20.371471
factor(am)1 19.9005360 23.767021
从构建的 95% 置信区间来看,具有平均 wt 和 qsec 的汽车(自动变速器)具有 MPG 区间 [17.4244, 20.3714],而具有平均 wt 和 qsec 的汽车(手动变速器)具有 MPG 区间 [19.9005。23.7670]。
两个置信区间重叠,我们未能拒绝零假设,即汽车(自动变速箱)的 MPG 性能和汽车(手动变速箱)的 MPG 性能在统计上没有差异。
我使用了两个等效的线性模型,它们给了我不同的结论。你能告诉我我在这里可能错过了什么吗?