回归模型指数分布

数据挖掘 回归 支持向量机 。网
2022-02-13 00:42:58

我有一个工单系统。我发现工单完成时间呈指数分布。每张票都有一些特点。我知道回归是“一条最适合点的线”。就我而言,我希望这条线是指数曲线。是否可以 ?还是指数分布的 CDF 是更好的选择?

我的用例是我想预测工单在截止日期前完成的概率。我正在考虑通过“分组”查询数据集,然后计算并存储 lambda 参数。当有新票进来时,我将拉取相应的 lambda 并使用 CDF 来确定 %age。我想知道 ML 算法是否可以简化这个过程。

我有.net 堆栈。我使用 Accord.net。我对其他 .net 库持开放态度。

1个回答

几年前,麻省理工学院的一个小组因为预测 twitter 趋势并以非常好的ROC-AUC 分数而受到广泛关注。你试图解决的问题有点像 twitter 趋势问题。该解决方案的关键在于,他们通过对相似时间序列进行分组,然后进行分类,避免了参数化建模的麻烦。

在Stan Nikolov 的博客文章中,对公众的方法有很好的描述请注意,他的论文导师也有一段演示视频

该方法的基本思想是找到时间演化中最常见的形状,并将其作为主导类。在您的情况下,这些将是各种指数形状(来自 Nikolov 的博客文章): 将时间序列分组为类

然后,您可以获取训练数据并为每个案例选择最佳形状。然后,您可以使用这些数据来训练分类算法。最后,您可以使用它来预测新数据的结果(来自 Nikolov 的博客文章): 通过分类进行时间序列预测

完整的论文也可以在线下载

实际上有整个公司都在使用这种方法并试图将其出售给公司。他们在 youtube 上也有一些非常酷的宣传视频,这些视频不会教你方法,但会展示它的强大功能。

希望这可以帮助!