我有一个带有离散标签的患者信息数据集(标签是特定疾病的阶段),需要预测(基本上是分类问题)。
数据集如下所示:
患者#|就诊#|与患者和就诊相关的其他医学特征|标签(疾病阶段)
因此,我有兴趣使用患者过去的就诊数据来预测当前的疾病阶段。但是,问题是所有患者的就诊次数都不相同。所以,我不能只附加过去的访问信息来预测未来的访问标签,如下所示:
concat(Patient #n 1st visit (X = all input features)|label of this visit| Patient #n 2nd visit (X = all input features)) 然后尝试使用之前的访问信息预测第二次访问的标签。
在上述问题中,就诊次数=1,但我对每个患者的就诊次数是不同的。我该如何解决这个问题?