我有由数值时间序列组成的训练数据(例如,100 天内网站上的用户活动指标)。我还有一些用户的分类属性(人口统计、浏览器类型、位置等)
对于新用户(比如在第 50 天)预测活动指标的未来值,无论是作为数值还是作为一个类别(低、中、高),什么是一种好的方法?
我可以想到以下方法:
A. 对初始分类特征的大多数(或所有)组合分别执行时间序列回归或分类。
或者
B. 从时间序列中提取 4 到 10 个不同的数值和/或分类特征(例如高、低、平均、周末水平、周末与工作日的比率等),然后对整个特征集执行随机 forrest 分类或回归。
或者
C. 别的?
谢谢!