我在具有 1.5MM 数据点和 120 个特征的数据集上使用非负套索(sklearn)。这是一个低 R2 环境(处理嘈杂的财务数据),所以约为 10%。不过,我更担心的是,预测的标准差大约是目标变量的标准差。同样,mean(abs(target)) / mean(abs(predicted)) 大约是.
我怎样才能让这个比率更接近1?我愿意牺牲一些为达到这个。我是否需要做不同类型的回归,以某种方式转换我的特征,或者还有什么可以做的吗?换句话说,对于我的应用程序来说,预测太平滑了。
如果可能的话,我想建议如何获得与目标大小相似的结果(预测),同时仍然具有相似(现在要低得多).
也许我应该使用不同的目标函数而不是 min。平方和?
