如何向客户解释全球时间序列模型?

数据挖掘 时间序列 预测
2022-03-03 21:35:23

对于我的一位客户,我需要用简单的语言解释全局模型的概念。到目前为止,搜索对该概念的简单介绍都失败了。我能找到的只是科学研究,主要是关于它们相对于本地模型的优势。

我需要解释的是与本地模型相比它如何工作的基本功能。我知道它基本上是相同的功能,只是我要将它适合一组时间序列而不是单个时间序列。因此,如果我有一组 100 个时间序列并想要预测接下来的 24 个月,我需要使用本地模型(每列)进行 100 次迭代,而使用全局模型只需要 24 次迭代(每个预测月)。

就数据对象和循环函数而言,这种全局预测究竟是如何发生的?我想解释一下,为什么它比本地模型快得多,以及为什么建议对相似时间序列组的集群进行预测,以实现更高的准确性。

请分享一些见解或一些好的在线参考资料

1个回答

如果您想为您的客户取得出色的成果,您需要本地和全球模型。

客户应主要了解预测的可靠性、置信区间及其背后的风险。

有一些算法可以估计预测的可靠性。他们可以轻松选择在特定情况下最好的模型。

由于季节性或重复行为,一些局部模型可能具有更好的可靠性。由于与其他变量的相关性或反相关性(有时有延迟),一些全局模型可能具有更好的可靠性。

预测可靠性算法为每个模型打分,客户会使用得分较高的模型。

因此,为了最大化收益,您需要首先拥有本地和全球模型。混合这两种东西的复杂模型可能不太有效,应该在第二阶段考虑。

然后,通过具体的例子,全局模型的兴趣是非常明显的。许多现实世界的时间序列与天气或任何其他环境影响有关。

应用相关热图向客户展示哪些是相关特征,哪些是反相关的,以选择最相关的特征总是很有趣的。如果您将相关性分析应用于许多特征,您可能会检测到人类无法检测到的令人惊讶的相关性。那些没有或几乎没有相关性的可以被丢弃。

一些工具,如降维(t-SNE、UMAP 等)和解释性白框可能会让客户相信全局方法,并可以解释变量之间的相关性。

总之,最佳方法将使用多个全局和局部模型,使用可靠性和可解释性工具来增加理解,做出更好的决策并改进模型。