涵盖基于事件的时间序列的数据科学分支?

数据挖掘 时间序列
2022-02-20 21:50:28

假设我有时间上的离散事件,例如病人生病,我想预测这些事件是否是其他一些潜在事件的指标,例如疾病爆发。通常,人们会将基于事件的时间序列转换为常规时间序列,例如通过汇总每周的患者人数。但是,我觉得这种聚合丢失了很多信息,并且很难用于事件的多个特征,例如患者的年龄、患者的性别等。我的问题很笼统:是否有一个统计分支/将时间序列视为由任意时间的事件组成的数据科学,而不是以均匀分布的间隔聚合值?

我试着用谷歌搜索它,但似乎很难用搜索引擎理解的方式来表达这个问题。

2个回答

“而不是以均匀分布的时间间隔聚合值?” 我认为这部分很好地定义了你的问题;即这通常是我们通常在通常的时间序列问题中所做的,将事件合并在一些离散的时间间隔中。

您可以做的是,您可以将事件之间的时间距离作为特征给出,而无需给出均匀分布的间隔。例如,每次疾病爆发或每个患者生病的事件之间的确切时间距离等。此外,您可以进行一些特征工程;连续双精度数 (x, x-1) 和 (x-1, x-2) 之间的时间差的平方或百分比变化,其中 xn,.....,x-2,x-1, x 是顺序事件,而不是时间。

这里的相关概念似乎是“不均匀间隔的时间序列”,维基页面维基百科:不均匀间隔的时间序列和该研究人员的网站http://eckner.com/research.html 似乎提供了足够的材料来开始使用。

这看起来像持续时间建模,又名生存分析您可以在此处找到 R 教程