将生存曲线估计预测到未来

机器算法验证 r 生存 卡普兰迈尔
2022-03-22 20:31:16

假设我使用 Kaplan -Meier 曲线有一条从 0 到 6000 天的生存曲线。我如何能够预测 6001 及以后的未来存活率?有没有我可以使用的函数或外推方法?

下面是一个例子,这只是为了说明:

library(survival)
library(ISwR)
mfit <- survfit(Surv(days, status == 1)~1, data = melanom)

如何将曲线投影到下面观察到的东西上?

在此处输入图像描述

编辑:

基于@CliffAB 的热烈响应,我想补充一下上述问题:

如果我们假设它是一个参数模型(与非参数 KM 曲线相比)和一个分布,例如对于上面相同的数据,我假设一个log normal分布并运行数据,我可以使用假设分布的生存函数来投影数据 ?

require(flexsurv)
parm.curves  <- flexsurvreg(Surv(days, status == 1)~1,dist='lnorm',data=melanom)
plot(parm.curves)

在此处输入图像描述

我正在处理的数据更多地是关于客户保留率,它的行为与上述数据不同。它仅用于说明目的。但这只是表明很难解决这类问题。我的问题是,我们可以使用假设的分布生存函数来预测未来的生存率吗?

谢谢

1个回答

据我所知,使用标准 R 软件无法推断超出这一点。

并且有充分的理由:Kaplan Meier 曲线没有对数据的参数分布做出假设。正因为如此,他们对最后观察到的事件之外的概率质量的分配完全漠不关心。

我在这里掩盖了一些细节,但假设在您的数据集中,观察到只有 30% 的受试者发生过事件。如果不对生成数据的参数族做出非常强的假设,您将很难估计 90% 的百分位数。因此,如果您真的想进行超过 t = 6,000 的估计,您可能需要切换到参数估计器(此外,您应该对这些估计持怀疑态度!!)