轮廓似然置信区间

机器算法验证 sas 轮廓似然
2022-04-09 23:27:09

轮廓似然(PL)置信区间(CI)背后的理论对我来说很清楚。(例如,请参见此处)。

SAS 在计算给定模型中所有协变量的 PL CI 方面速度惊人。因此,我想知道是否有另一种计算 PL CI 的方法,它不需要在给定感兴趣参数的不同固定值的情况下,最大化似然性(在讨厌的参数上)的耗时循环。

示例:我在 SAS 中对约 43000 个具有 10 个协变量(+ 截距)的受试者进行逻辑回归。在不要求 PL CI 的情况下拟合该模型需要 0.6 秒,而当我还需要所有 10 个协变量的 PL CI 时(选项clodds=pl中的选项proc logisitc)只需要 3 秒。在 Stata 中,相同的模型在 0.35 秒(没有 PL CI)内拟合,当向 PL CI 询问模型中 10 个协变量中的一个时,在 10 秒内拟合(我使用了该pllf命令,它迭代地修复了感兴趣的参数的值并最大化剩余的可能性)。

1个回答

非常好的问题。

此链接中,解释了 SAS 使用数值近似(基本上包括对 Newton-Raphson 算法的修改)

根据 Wald 检验和轮廓似然法,将此选项设置为 both 会产生两组 CL。(Venzon, DJ 和 Moolgavkar, SH (1988),“一种计算基于轮廓似然的置信区间的方法”,应用统计,37, 87-94。)

JSTOR中论文的链接在这里,摘要如下所示

基于广义似然比统计构建置信区域的方法对于参数向量是众所周知的。可以通过重复最大化其他参数来实现向量单个条目的置信区间的类似构造。我们提出了一种算法来找到这些需要较少计算的置信区间端点。它采用修改后的 Newton-Raphson 迭代来求解定义端点的方程组。

根据这个摘要,这似乎就是快速计算的秘诀。