我正在运行一个分类器(逻辑回归)。我的数据集上的信息如下:
dataset size= 279 observations
(80/20 规则)
train size= 233
test size = 56
# of events in train = 31
# of events in test = 8
我认为我的分类器和结果可能会由于这个不相等的比例而受到影响。有什么方法可以避免偏差问题并提高准确性?您个人如何看待这些数据?
我正在运行一个分类器(逻辑回归)。我的数据集上的信息如下:
dataset size= 279 observations
(80/20 规则)
train size= 233
test size = 56
# of events in train = 31
# of events in test = 8
我认为我的分类器和结果可能会由于这个不相等的比例而受到影响。有什么方法可以避免偏差问题并提高准确性?您个人如何看待这些数据?