我正在尝试为严重偏斜的目标时间序列构建一个回归预测模型。
您可以将目标想象为地震震级或暴雨。大多数时候,我们坐在相对无聊的分布头部,但我们想预测有趣的“极端”事件。
目标值的分布看起来像这样(在带有贝叶斯块大小的直方图中)

被接近的单独或组合是合法的吗?:
f(log(target))在空间中预测。其中f(x)用于产生零均值、单位方差分布。- 首选非线性(例如,基于树的、具有非线性内核的支持向量回归器)估计器。
- 在选择用于学习、验证和测试的样本时:相对过采样目标分布的右尾。
还有什么我应该尝试的吗?
如果它有助于上下文,我正在使用 python 和 sklearn。