我有一个糖尿病患者数据集,我正在尝试预测下一个血糖水平。我在下面附上了一张图片,该 csv 文件中有大约 1600 条记录,其中包含 10 位患者的数据。每个患者由 Id 列唯一标识,Glucose_t-1 表示患者在当前读数 (Glucose_t) 之前的葡萄糖值,这同样适用于 Glucose_t-2 和 Glucose_t-3。同样适用于 Insulin_t-1、Insulin_t-2。事件列是血糖值的当前读数下降到的血糖事件。例如,
- 血糖值 <= 70 然后 0,
- 70<血糖值<=180则1,
- 血糖值 > 180 然后 2。
我应用了不同的回归算法,如 Logisitic 回归、随机森林回归等,但我无法准确预测 Glucose_t 值。精度达到 0.008 .. 非常令人沮丧 :(。请任何帮助提高精度的帮助将不胜感激。谢谢。