生存分析中“死亡率”的定义是什么?

机器算法验证 生存 冒险
2022-03-28 04:04:38

我正在阅读一篇关于生存分析的文章(Smith 的 2002 Analysis of Failure and Survival Data)。所有概念,如风险函数、生存函数、生存变量密度Y是严格定义的。然而,在一个练习(第 14 页)中,它说“假设吸烟者在每个年龄的死亡率是不吸烟者的两倍。如果hs(y)表示吸烟者在年龄时的危险率yhn(y)年龄不吸烟的人y,写出一个相关的方程hs(y)hn(y)”。

这让我不明白作者所说的死亡率是什么意思(据我所知,它还没有被定义)。也许他的意思是生存函数的导数或类似的东西。

这个想法可能得到谷歌搜索的支持,我在其中找到了定义

λ=DT

在哪里D时间间隔内的死亡人数T. 因此,在概率方面,我会得出一个有用的定义可能是

λ=F(Y+t)F(Y)t

在哪里F(Y)累积分布函数。此外,如果我让

limt0F(Y+t)F(Y)t=f(y)=S(Y)

在哪里f密度和S生存函数。

这个逻辑在某处是形式化的还是约定俗成的?

2个回答

费率有一个特定的定义#events#person-years. 另一方面,风险是指特定个人经历感兴趣的结果的风险,它是与危险本质上相关的风险(瞬时风险)。问题使用的语言与这种理解是一致的。如果我不得不改变它,我会说,“吸烟者的死亡率是*非吸烟者的两倍”。他们也没有提及这些是否是年龄调整率。

为了更深入地理解这一点,使用根本不同的模型来估计相对利率相对风险。

如果您想正式确定费率,您可以将其视为估算:

E(#events#person-years)=iPr(Yi<ti)iti

(Yi是死亡时间和ti是观察时间i-个人,注意时间被认为是固定的而不是随机的!)

您会认识到分子是一堆 CDF,或 1-生存函数,并且与生存函数和危害的关系是众所周知的。

因此,如果您采用比率比率:

2=E(#smoker deaths×#non-smoker person-years#nonsmokerdeaths×#smoker person years)=itijtjjPr(Yj<tj)iPr(Yi<ti)

=itijtjnjjS(tj)niiS(ti)

因为它是自学,你可能应该做代数并解决方程的其余部分!

“死亡率”本质上是指危险率。死亡率通常报告为每年每 100,000 名受试者的死亡人数,这使得死亡率与危险率成正比,因此它们不一定完全相同

关于这本书,正如您所说,问题的“i”部分很容易使用他们要求您在问题的“ii”部分证明的内容,我们实际上可以证明比例风险意味着比例死亡率,以防您不想盲目相信我的话。你不应该这样做。

“ii”部分说“使用危险率之间的关系,表明吸烟者的生存概率是非吸烟者生存概率的平方”(释义)。

这告诉我们

Ss(t)=Sns(t)2

由于危险率与生存曲线有关

S(t)=eh(t)

这意味着

ehs(t)=(ehns(t))2

进一步暗示

ehs(t)=(e2hns(t))

最后留给我们hs(t)=2hns(t)(提供了一些关于风险函数平滑度的假设)。

自从hs(t)=2hns(t),请注意,这与“死亡率”描述的关系完全相同。从技术上讲,这并不能证明“死亡率”与危险率相同,但它暗示如果死亡率成比例(无论它们是什么),那么危险率也是成比例的。