我如何建模这个问题来训练机器学习模型

数据挖掘 机器学习 机器学习模型
2022-02-26 23:09:47

我是机器学习的新手,需要帮助了解如何对以下(假设的)问题进行建模。

假设我记录了有关数千人的以下信息。

365 天里,每一天我都会记录下每个人的以下信息。

  1. 人的体重
  2. 性别(男性为 1,否则为 0)
  3. 卡路里摄入量
  4. 燃烧的卡路里
  5. 睡了一小时

所以我的完整数据集看起来像这样

人1

重量 性别 热量摄入 烧焦的 睡了几个小时
1 82 1 2010 1890 6
2 81.5 0 2050 1785 8
... 81.7 1 2055 1780 7
365 81.2 1 2060 1810 7

人2

重量 性别 热量摄入 烧焦的 睡了几个小时
1 ... ... ... ... ...
... ... ... ... ... ...
365 ... ... ... ... ...

等等。

我想使用这些数据在 python 中训练一个模型。该模型应该能够执行以下操作:

我将提供一个新人的 30 天信息作为模型的输入,它会给出一个二进制值,指示该人在未来 7 天后会变瘦还是变胖。这可以做到吗?

编辑:我想学习如何解决这样的问题、合适的算法以及如何塑造我的数据。不担心训练模型的准确性,因为我不会在现实生活中使用它。

1个回答

您可以对这个问题使用时间序列预测。TensorFlow 网站上有一个天气数据示例:他们的模型根据数据中连续样本的窗口进行预测。对于“windows”的定义,请检查此步骤您应该能够使该过程适应您的问题。

对于您的数据,定义“卡路里不足/过量”而不是单独使用摄入/燃烧可能是一个好主意,因为这将是定义值。此外,摆脱将性别作为分类数据的明确引用可能是一个好主意。我在想也许可以将它与使用 BMI 之类的东西作为参考点的权重列合并,但你没有身高信息,所以也许它可以与其他使用男性或女性每日推荐卡路里摄入量的数字数据一起使用。