我应该在医疗问题中使用什么机器学习技术

数据挖掘 机器学习 分类 数据挖掘 支持向量机
2022-02-20 11:01:57

如果我有以下情况,对药物响应者进行分类的最佳机器学习技术是什么:

  1. 具有约 200 个特征的临床数据(年龄、教育程度、婚姻状况等)
  2. 具有大约 25 万个特征的基因数据(从患者身上提取的基因组数据(片段)(DNA 分析))
  3. 观测数。~ 4K(数据来自对 4000 名患者的研究)。

请指教。

1个回答

通常,您需要对要问的问题进行更准确的措辞(用更数学的术语)。

病人会对药物 X 有反应吗?可能性是多少?患者对药物 X 的反应量是多少?患者是否在预期对药物 X 有反应的组中?可能会影响技术选择的稍微不同的问题。

此外,您的数据起着重要作用。你缺少数据吗?你已经正常化了吗?您认为“婚姻状况”或“教育程度”会对药物效率产生影响吗?(如果某些群体在家吃药可能会,但在医生监督下服用的可能性较小)

您先验地确定如何衡量或量化模型的成功(通常是预测准确性)。

然后通常你会尝试一些机器学习技术,并从最成功的技术中制作模型。