我为回归问题建立了 xgboost 模型。默认情况下 xgboost optimize,因此 RMSE 将是衡量性能的最佳评估指标。但我的任务是建立评估指标的最佳模型,该模型检查预测值是否在范围内,即。您对此有任何想法,或者 MSE 仍然是最佳选择吗?
成本函数 - 想法
数据挖掘
回归
xgboost
成本函数
2022-02-17 19:55:18
2个回答
根据我的经验,很难为 xgboost 提供良好的自定义目标函数。
自定义目标需要是连续的,并且需要具有凸梯度和非零粗麻布,而自定义损失函数通常不是这种情况。
您可以使用的一种更简单的方法是根据您的范围 +/-10 定义自定义验证指标,该指标可以与提前停止结合使用以优化 xgboost 模型的超参数。因此模型不会直接为此进行优化,而是会选择能够最小化您的自定义损失的超参数。但是,对于这个问题,我建议坚持使用 RMSE 目标。
你可以有两种方法:
- 正如@fhaase 所述,继续您的回归模型,直到获得所需的输出,即 -/+ 10。
- 您也可以将其作为二元分类问题进行尝试,如果输出在所需范围内,则将其视为 1,否则将其视为 0。在这种情况下,您有机会探索不同的成本函数,例如log_loss。
所以步骤将是:
- 尝试任何回归算法。
- 在步骤 1 的结果之上应用 Sigmoid 函数。
- 优化步骤 2 的输出。
其它你可能感兴趣的问题