如果我有以下情况,对药物响应者进行分类的最佳机器学习技术是什么:
- 具有约 200 个特征的临床数据(年龄、教育程度、婚姻状况等)
- 具有大约 25 万个特征的基因数据(从患者身上提取的基因组数据(片段)(DNA 分析))
- 观测数。~ 4K(数据来自对 4000 名患者的研究)。
请指教。
如果我有以下情况,对药物响应者进行分类的最佳机器学习技术是什么:
请指教。
通常,您需要对要问的问题进行更准确的措辞(用更数学的术语)。
病人会对药物 X 有反应吗?可能性是多少?患者对药物 X 的反应量是多少?患者是否在预期对药物 X 有反应的组中?可能会影响技术选择的稍微不同的问题。
此外,您的数据起着重要作用。你缺少数据吗?你已经正常化了吗?您认为“婚姻状况”或“教育程度”会对药物效率产生影响吗?(如果某些群体在家吃药可能会,但在医生监督下服用的可能性较小)
您先验地确定如何衡量或量化模型的成功(通常是预测准确性)。
然后通常你会尝试一些机器学习技术,并从最成功的技术中制作模型。