应该在哪一步使用 SMOTE 技术进行过采样?

数据挖掘 数据挖掘 预处理 过拟合 阶级失衡 打击
2022-02-14 02:21:58

我想使用 SMOTE 技术进行过采样,但我不知道应该在预处理的哪个步骤上使用它。

我的预处理步骤是:

  • 缺失值

  • 去除异常值

  • 平滑数据

我应该在所有这些步骤之前使用 SMOTE 还是在这些步骤之后使用它更好?

1个回答

如果您使用的是 python,则不能在存在空值的情况下使用 SMOTE。

在这种情况下:

  1. 移除异常值
  2. 平滑数据
  3. 估算空值(在 R 中有一些智能选项:使用随机森林进行估算)
  4. SMOTE

首先去除异常值可以让您更好地进行平滑和插补。