将 Horse Colic 数据集视为二元分类问题是否合理?

数据挖掘 分类
2022-03-15 21:56:42

我正在学习 Horse Colic数据集

有据可查的属性;具有 28 个属性(连续、离散和标称)的 368 个实例;30% 缺失值

有 3 种结果,“活着”、“死去”、“被安乐死”。

由于“被安乐死”是“死亡”的另一种形式,将这个问题视为二元分类问题是否合理?

1个回答

这取决于你的目标。

如果您对马的状态感兴趣,那么这是一个多类分类问题。

或者,如果您只关心马是否死亡而不关心它是如何死亡的,那么您可以将其视为二元问题(在将“安乐死”与“死亡”分组后)。