我一直在寻找一些方法来改进我的预测模型,但到目前为止找不到任何方法。我有用于预测的数据,包括 10 个数字特征。我使用了随机森林回归模型,它在训练集上完美运行(部分完美来自过度拟合)。
但是,对于某些特征不在样本数据范围内的数据点,该模型做得并不好。例如,样本中的参数 x 介于 0 和 2000 之间,但我们要预测的新数据点的 x 值为 3000。
我知道这是由于数据限制,但我想知道是否有任何方法可以生成样本或改进预测?
我想建立一个不包括这个参数的简单模型,但问题是这是我模型中最重要的参数。
任何提示表示赞赏。