在此页面上,我对靠近页面底部的“拟合优度”部分感兴趣,其中包含偏差函数表。
作者指出,比例偏差,即有一个限制分布,其中是观察次数和是预测参数的数量。
然后他继续说,在这种情况下是未知的,可以预测为. 如果是这种情况,比例偏差不等于? 我想我误解了两者之间的差异和(没有参数)。
缩放后的 Pearson 卡方统计量也会发生类似的情况。
有人可以详细说明在这种情况下如何计算比例偏差是未知的,如何进行gof测试?
在此页面上,我对靠近页面底部的“拟合优度”部分感兴趣,其中包含偏差函数表。
作者指出,比例偏差,即有一个限制分布,其中是观察次数和是预测参数的数量。
然后他继续说,在这种情况下是未知的,可以预测为. 如果是这种情况,比例偏差不等于? 我想我误解了两者之间的差异和(没有参数)。
缩放后的 Pearson 卡方统计量也会发生类似的情况。
有人可以详细说明在这种情况下如何计算比例偏差是未知的,如何进行gof测试?
我认为当您允许未知分散时,GLM 不再是最大似然技术,而是最大化“准”似然。因此,通过使用样本分散作为模型分散来固定偏差(作为最大化准似然的结果)。通过将色散视为拟似然中的参数,例如拟二项似然的族等价于直到比例常数的二项似然。最大化拟似然将该常数视为讨厌的参数。
可以这样想:当基础 GLM 的概率模型正确时,样本偏差的期望值为 1(如您的公式和上面的限制分布声明所证实)。但是该数据的随机变化将表明概率模型并不总是完美地拟合这些数据。
当样本偏差与样本偏差大不相同时,这表明工作概率模型不是观察数据的良好概率框架。这并不意味着对参数的推断是不正确的。事实上,通过使用缩放偏差,您可以在工作 GLM 中解释这种过度分散或分散不足,并获得对参数的正确推断。这是从最大拟似然得到的 GLM。
我建议查看 Alan Agresti 在 Categorical Data Analysis 第 2 版中关于鲎和拟泊松和拟二项式模型的示例,以进一步澄清。