我正在学习 Horse Colic数据集。
有据可查的属性;具有 28 个属性(连续、离散和标称)的 368 个实例;30% 缺失值
有 3 种结果,“活着”、“死去”、“被安乐死”。
由于“被安乐死”是“死亡”的另一种形式,将这个问题视为二元分类问题是否合理?
我正在学习 Horse Colic数据集。
有据可查的属性;具有 28 个属性(连续、离散和标称)的 368 个实例;30% 缺失值
有 3 种结果,“活着”、“死去”、“被安乐死”。
由于“被安乐死”是“死亡”的另一种形式,将这个问题视为二元分类问题是否合理?
这取决于你的目标。
如果您对马的状态感兴趣,那么这是一个多类分类问题。
或者,如果您只关心马是否死亡而不关心它是如何死亡的,那么您可以将其视为二元问题(在将“安乐死”与“死亡”分组后)。