我正在准备分类模型。许多数值变量都是正数偏斜的。我应该将变量的分布更改为更加高斯吗?
数据偏度的影响
数据挖掘
机器学习
统计数据
数据科学模型
特征缩放
分配
2022-03-14 20:25:09
2个回答
数据不一定要标准化,主要来自我们想要使用的模型。
常态在许多情况下是一种假设。在这种情况下,正态性意味着预测和实际答案之间的误差是正态分布的。
你用的是什么型号?
理想情况下,在将数据输入某个 ML/统计模型之前,应该始终对数据进行缩放/规范化。通过使用 Z 分数,您应该能够控制变量的偏度。
其它你可能感兴趣的问题