统计数据能在多大程度上改善患者的治疗?

机器算法验证 模型 生物统计学
2022-04-15 06:02:08

一位朋友的母亲要求我分析她过去治疗的数据。自从两年前得了白血病后,她就经历了不同时期的住院治疗,接受了各种治疗。所以我可以下载一个数据图表,其中包含药物 A、B、C、D、E 等药物之后的时间点和测量值。但是测量值不在一个水平上,使我能够通过简单的图表将它们相互比较,但更像心率和血压一定有些相关,但平均值和标准差不同。手头有 5-6 种药物和 2 年的数据可供我使用,我无法真正正确地分析数据,因为我是一名数学家,没有经过适当的统计培训。但现在我想问一下这个问题,因为那个朋友死于白血病,我希望我能有所作为,

我想从这个个人经历中提出的问题是:我们可以通过统计方法在多大程度上帮助(真实)患者?我们如何能够设法提取一个不太大的离散数据集(例如 300-600 个数据点)背后的隐藏关系,并有合理的信心这可能意味着什么?假设我们拥有所有可用的编程能力并且金钱问题不是真正的问题,那么我们是否真的希望我们可以收集个人数据以在个人层面上帮助患者?我不是统计学家,我尝试了变量之间的线性回归,但由于它们之间似乎没有明显的关系,因此失败了。所以我想问问专业人士对此的看法。

(我已经阅读了至少 100 多篇白血病论文,试图找到一些可能在生物学上或通过数学生物学(如人口动力学)有所帮助的东西,但我失败了)

更新:

我忘了写metamed(一家医疗初创公司)确实提供个性化的医疗分析,似乎主要基于患者的基因数据。他们收取极高的价格。但是我不知道他们的服务是否可靠。就我个人而言,我朋友的家人决定不寻求他们的帮助。我真的不知道这是否会产生任何影响,因为在她的案例中,所有治疗(实验性或成熟的)方法都已用尽。由于其他人可能对此线程感兴趣,因此我决定在此处包含此 25c。

3个回答

@user32240,首先,对于您的损失,我深表歉意。看着我们所爱的人治疗失败或看着朋友的家人治疗失败是相当困难和痛苦的。我认为我们是一种寻求模式的物种,而这种特征是帮助我们进化的一部分。例如,我们能够识别出一种天气模式,这种模式转化为知道何时最好地保护自己免受洪水侵袭。患者会寻找一种模式并责怪最接近变化的事件。这就是开发科学方法的原因,以确保我们不会仅仅因为轶事证据而将患者暴露在危险的程序中。

就个人而言,我们可能会发现某人的症状因刺激物而加剧或因治疗而得到缓解,但只有在多次接触或戒断后,我们才能轻松得出关联结论。在样本量为 1 且没有重复曝光的情况下,似乎不可能找到任何有意义的东西。有时我们能做的最好的事情就是不要丢失这些数据,并将其与其他患者的经验结合起来。也许将来有人会得到帮助。

永远,永远不要,对一个人的健康问题应用统计数据。不是因为伦理原因,而是因为我们对驱动我们生物学的过程仍然知之甚少,尤其是在它们的相互作用中。它们是如此复杂,以至于与它们相比,我们当前统计知识的复杂程度简直是可笑的。当然,医学在很大程度上依赖于统计数据,而不是分析一个人的健康数据,而是为了根据许多患者积累的知识(包括统计结果) 来评估评估这个人的健康数据……

我知道这更多是一种观点而不是答案,但我也试图为我的观点提供一些论据。我喜欢统计数据,我不想看到它们与谋杀有关。

我想说,有个人利益的人花时间调查个人层面的数据是非常值得的。正如 Poisson 等人在近 200 年前首次将“数值”方法应用于医学时所指出的那样,通过比较平均值所能学到的东西非常有限:

在统计领域,也就是说在对事实进行数值评估的各种尝试中,首要任务是忽略孤立地看待的个体,将他视为物种的一小部分。他必须被剥夺他的个性,以消除这种个性可能引入手头问题的任何意外。

相反,在应用医学中,问题始终是个人的,必须找到解决方案的事实只能一一呈现;问题始终是患者的个人个性,最终医生必须治疗的始终是具有所有特质的单身人士。对我们来说,群众与这个问题完全无关。

一般来说,概率计算表明,在所有其他条件相同的情况下,如果所使用的观察结果同时包含大量事实或个人,那么待确定的真相或规律就会更好地接近。那么,这些规律,就其产生的方式而言,不再具有任何个性。因此,不可能将它们应用于一个人的个人机会,而不会使自己面临许多错误。

Civiale 医生对结石引起的疾病的统计研究。1835. 国际流行病学杂志。2001 年 12 月;30(6):1246-9。Poisson、Dulong、Larrey、Double 经典报告的再版。

与个人数据有关的事情是寻找模式并理论化哪些机制可能对模式负责。组平均值通常隐藏个别模式,并且在许多情况下可能导致对潜在机制的错误推断。

分析组级数据的另一个问题是个体差异被视为噪声,如果重复测量,则个体内部差异也被视为噪声。生物数据由确定性信号 + 随机噪声组成的想法是一个相当不合理的假设。它简化了分析,但也导致许多研究人员忽略了研究不一定是“随机”的变异性。

研究变异性的一个领域是心血管生理学:

心率变异性测量标准、生理解释和临床使用 循环。1996;93: 1043-1065 doi: 10.1161/​01.CIR.93.5.1043

另一个是运动系统的研究:

运动行为的可变性和确定性 Michael A. Riley 和 MT Turvey 运动行为杂志,2002 年,卷。34 号 2 号 99-125

因此,您可以做的是随时间绘制每个参数的数据,并研究模式可变性的结构。即使只是目不转睛地看它可能会起作用,您也可以从上述领域中找到方法。

您的目标之一可能是比较治疗方法。最好的“n=1”实验是测量基线,给予治疗,取消治疗,然后再次给予治疗。如果治疗效果如您所愿,您应该预期效果会出现、消失,然后再次出现。在您的情况下这是不可能的,但也许在可能发挥类似作用的治疗背后的推定机制存在相似之处和不同之处。