我有一个包含消费的数据集。这些消耗量每月测量一次。但有些月份没有测量。因此,未测量月份之后的测量月份实际上值得两个月(或更多)的总和。
我的数据集;
difference
date
2019-01-01 50.0
2019-02-01 60.0
2019-03-01 NaN
2019-04-01 140.0
2019-05-01 90.0
所以我们可以理解,第 4 个月的值实际上是第 3 个月和第 4 个月的总和。有必要用这种逻辑组织这些数据。因为 140 不是第 4 个月的正确值,并且第 3 个月的消耗不为零。
difference
date
2019-01-01 50.0
2019-02-01 60.0
2019-03-01 70.0
2019-04-01 70.0
2019-05-01 90.0
这(平均值)可能是避免数据集上出现此问题的一种方法。之后,我可以使用这个数据集来预测下个月的消费。
我想知道这种方法是否有名字。我可以在这种类型的时间序列数据集上实施哪些解决方案?我该如何搜索这个问题?