我正在尝试将 SMOTE 应用于具有时间约束的数据集。我有关于用户访问网站的信息。对于某些功能,有时间限制,例如在网站上的第一次访问和最后一次访问,第一次访问(时间戳)总是低于或等于最后一次访问。如果我申请 SMOTE(或 SMOTENC 分类),我最终会得到最后一次访问发生在第一次访问之前的合成样本。这会导致样本在现实世界中不存在,因此会对模型的性能产生负面影响。有没有办法应用 SMOTE 并施加某些规则。或者,是否有可以解决这个问题的过采样技术?
SMOTE 和带约束的过采样
数据挖掘
阶级失衡
打击
不平衡学习
smotenc
2022-03-13 20:34:18
1个回答
一种选择是做一些更类似于引导的事情,因为这将重新采样现有数据。
另一种选择是生成额外的样本,然后根据约束进行修剪。
其它你可能感兴趣的问题