我应该如何处理对数秩(和相关)测试中违反比例风险的后果?

机器算法验证 生存 假设 冒险 对数秩检验
2022-04-03 14:23:47

我有(审查)四组受试者的事件发生时间数据。我想做一些类似对数秩检验的事情,但生存曲线不满足比例风险假设。我想我听说过道具的后果。危害违反是失去识别生存曲线之间差异的能力,但是,在我的研究中,对数秩检验确实显示了组之间的显着差异。

比例风险违规采取以下形式:一组在观察期早期发生事件的概率相对较大,而另一组在观察期后期发生事件的概率相对较大。我相信 G-系列测试(例如在R 的生存包中的函数中)可以被参数化,以便观察期的早期或后期部分的权重更大。但是,在这种情况下,不同的组会在不同的测试规范中“做得更好”(正在研究的事件是一件好事)。ρsurvdiff

我想知道几件事:

  1. 如果尽管存在比例风险违规,logrank 函数确实发现了显着差异,我们能否将其解释为表明曲线之间存在真实(整体或平均)差异?或者这种违规是否意味着测试的结果完全没有意义?
  2. 在像我这样的情况下,是否有一种描述生存时间的原则方法?理想情况下,我希望能够报告总体风险比(我知道 - 这将缺乏非比例风险和审查观察的外部有效性,但在描述实验时会很有用),并提供有关哪些信息群体更有可能在什么时候发生事件。我可以在观察期的中间选择一个断点,然后在前后进行单独的测试(假设这些数据子集确实满足比例风险假设),但是这样一个点的选择感觉有点临时。

相关讨论:

该线程讨论了 logrank 测试的替代方案,但没有考虑我的问题: 在生存分析中使用 logrank 与 Mantel-Haenszel 方法计算风险比的优缺点是什么?

2个回答

无论危险的真实情况如何,对数秩检验都是有效的。你是对的,只有它的力量受到影响。因此,如果它拒绝,那么危害是不相等的。如果它不拒绝,那么你不得不担心危险和权力的比例。

原则性方法将尝试在与时间相关的问题中估计两种危害的差异/比率。这并不简单,但可行。我会推荐 Martinussen 和 Schalke 的书:Dynamic Regression Models for Survival Data以及相应的 R 包timereg可能还需要知识渊博的统计学家的支持。请注意,这超出了标准的生存分析费用,因此不是每个人都知道这些技术。

最后一点:如果风险不成比例,那么您就不能有一个风险比值。

实际上,当使用对数秩检验而没有比例风险时,只会影响功效。然而,如果选择一个新的测试/模型事后(即在确定风险不成比例之后),结果可能无效。本文展示了 I 类错误率如何被夸大:

http://onlinelibrary.wiley.com/doi/10.1002/sim.6021/abstract