如何使用 Pr (>Chi) 和 Df 确定变量是否显着?

机器算法验证 r 统计学意义 方差分析 卡方检验 自由程度
2022-03-26 04:59:22

我想知道如何使用 Pr (>Chi) 和 Df 确定变量是否显着?以下面的方差分析表为例,我知道变量type很重要,但我不知道为什么。

##        Df  Deviance       Resid.Df       -2*LL      Pr(>Chi)
## NULL   NA        NA             28      103.49            NA
## write   1    16.689             27       86.81     4.403e-05
## rating  1     6.097             26       80.71     1.354e-02
## type    2    14.450             24       66.26     7.280e-04
2个回答

这实际上看起来是一个偏差分析表,但原理是一样的,人们仍然称它为“方差分析”表。该表提供了有关一系列顺序嵌套模型拟合的信息。第一行是空模型(不包括任何变量)。随后的每一行都将另一个变量添加到模型中,并提供有关更改的信息。以相反的顺序移动更为典型(即从“完整”模型向下移动,一次删除一个变量),但这无关紧要。

如果这些列以不同的顺序呈现,它们可能更有意义。第四列包含拟合优度的度量();请记住,较低的值意味着更好的拟合,并且无论该变量是否相关,都必须在添加变量时改善拟合。第二列 ( ) 显示该型号与之前型号之间的差异。第三列 ( ) 表示每个模型有多少剩余自由度。在第一列中,您看到列出了与每个变量相关的自由度,它是该模型的剩余自由度与之前模型的差异。这里要实现的是两个嵌套模型之间的区别2×log likelihoodDeviance-2*LLResid.Df-2*LL(即偏差)作为卡方变量分布,其自由度等于两个模型的剩余自由度之差。最后一列 ( )-2*LL中显示了在添加了具有这么多自由度的变量的情况下看到如此大或更大差异的概率。Pr(>Chi)因此,在规定了一个 / type I 错误率之后,我们可以看到添加变量后模型拟合的改进是否大于我们单独偶然预期的结果。 α

(您之前选择的显着性水平),您最容易判断其中一个变量的显着性。α

基本上任何假设检验都是如此,而不仅仅是卡方检验。

你没有说明你的显着性水平,所以我不能谈论这些系数中的哪些是显着的。