累积发生率与 Kaplan Meier 估计故障概率

机器算法验证 生存 生物统计学 卡普兰迈尔
2022-03-25 07:03:31

为了估计医学科学中的概率失败,使用 1-KM 并不是非典型的。然而,这并没有考虑到竞争风险,例如自然原因或与疾病无关的原因导致的死亡,这些风险排除了感兴趣的事件。因此,1-KM 提供了一个不充分的测量和累积发生率曲线,例如 cmprsk(在 R 中)中使用的曲线。

我的问题是,许多医学文献仍然报告 KM 曲线甚至 1-KM。这是否意味着许多医学文献中报告的结果可能不准确(或更准确地说是高估了)?或者是否有理由首选 1-KM?

此外,如果 1-KM 和累积指数曲线之间存在差异,您的分析的其他部分也会受到影响(即辨别、校准......)?

3个回答

让我预先声明,我没有你所有问题的答案。我在竞争风险方面不如生存分析的简单应用那么强。所以,我将在这里抛出一些可能有用的信息。我怀疑 KM 曲线更常见,因为它们更老并且在概念上更容易理解(对于研究人员和研究消费者而言)。如果竞争风险是真正独立的,那么我认为 KM 估计应该是无偏的。也就是说,人们可能更喜欢 KM 曲线的一个合理原因是,许多人已经了解它们,如果那些因其他原因而死亡的患者会走上与其他人相同的道路,那么 KM 曲线很有用说明从研究中学到的东西。

关于文献中是否存在高估的问题,与这些问题不同的一个相关事实是,出于实际目的,出版通常需要“意义”。这保证了文献是有偏见的(特别是高估),这个问题被称为文件抽屉问题

你应该看看 Jason Fine 在竞争风险建模方面的工作。代替 Kaplan-Meier 的是累积发生率函数,也类似于生存分析中的危险函数是原因特定的危险函数。他使用了一个名为 Gray-Fine 模型的竞争风险模型。我最近在康涅狄格州耶鲁大学的一次会议上听到了他的讲话。如果你给我发电子邮件,我可以把讲座幻灯片发给你。以下是一些关于参考资料的信息以及 Bob Gray 网站的链接,我从他的一张幻灯片上取下了该链接。

CIF 的推论:一个样本,正确的删失 • 使用 Kaplan-Meier (KM) 估计 Fk 的幼稚方法对于相关风险是无效的 • 即使风险独立,KM 也会估计 Tk 的分布,其中其他原因导致的死亡是不可能的 • 有效的估计量(等价于 MLE)通过将 S 的 KM 估计量和 K 的 NA 估计量替换为 Fk 获得(Aalen,1978 年;Gray,1988 年;Pepe,1991 年) • ABGK 中一般计数过程框架的特殊情况,通过鞅结果处理技术问题和CIF 的替代产品积分表示 • 在 Bob Gray 的网站 biowww.dfci.harvard.edu/gray 上的 R 函数“cuminc”中可用

一般来说,累积发病率与生存率并不相反。如果一个人只能经历一个事件,是的,就是这样。但是,如果您要比较疱疹爆发的风险(一个人在研究期间可能有几次爆发),则累积发病率曲线将解释总爆发量。那么,这条曲线的自然估计量来自泊松模型。