关于解释对数似然(和似然比检验)输出的困惑

机器算法验证 最大似然 lme4-nlme
2022-03-19 08:00:45

我正在使用nlmeR 中的包来使用混合效应模型来分析多级(即嵌套在教室中的学生)数据。

我对解释这些函数的对数似然输出感到困惑,虽然还有其他问题可以解决为什么对似然统计量取对数以及为什么它是负数,但尚不清楚这些如何适用于解释这些值。

特别是,输出负对数似然。由于估计方法最大化对数似然,我理解较大的值表示更好的拟合。

这种解释是否适用于(负)对数似然输出,因此较大(即更接近0)值表示拟合更好,因此如果我比较,例如,使用函数的对数似然值-3146.9和似然比率检验表明与 p 值小于 相关的检验统计量,那么具有对数似然 的模型表现出更好的拟合?-2931.41anova().05-2931.41

2个回答

我们采用对数似然,因为数据集中的每个案例都有一个可能性,而对数似然是这些可能性的乘积。但是这些可能性中的每一个都小于 1,当你将许多小于 1 的数字相乘时,你往往会得到非常非常小的数字。

这些非常小的数字没有错——除了我们在使用的计算机上达到了精度限制。尝试对 -3000 和 -2000 的对数似然取幂。我怀疑您的计算机会说它们都为零-因此两种模型的可能性都为零-并且无法区分。

因此,与其尝试将许多值相乘,不如取它们的日志并将它们加在一起更容易。所以我们没有得到一个可能性,我们得到一个对数似然,并且我们没有达到精度限制。

然后@PlayStarCraftOkLetsGo 的回答。

我们尝试最小化负对数似然函数,这相当于最大化对数似然函数。具有较低负对数似然值的模型将更适合。