数据偏度的影响

数据挖掘 机器学习 统计数据 数据科学模型 特征缩放 分配
2022-03-14 20:25:09

我正在准备分类模型。许多数值变量都是正数偏斜的。我应该将变量的分布更改为更加高斯吗?

2个回答

数据不一定要标准化,主要来自我们想要使用的模型。

常态在许多情况下是一种假设在这种情况下,正态性意味着预测和实际答案之间的误差是正态分布的。

你用的是什么型号?

理想情况下,在将数据输入某个 ML/统计模型之前,应该始终对数据进行缩放/规范化。通过使用 Z 分数,您应该能够控制变量的偏度。