标准化来自不同组的数据

数据挖掘 Python 熊猫 正常化 通过...分组
2022-03-12 17:18:34

我有按不同标准分为 27 组的数据。这些分组的原因是为了表明每个组都有不同的行为。但是,我想将所有内容标准化为相同的规模。例如,我想标准化为 0-100 的 0-1 比例,这样我可以说类似43rd百分位数,并且在各组之间具有相同的含义。如果我只是说,通过减去每个的平均值并除以标准偏差来单独标准化每个,这会工作吗?我是否必须计算所有组合数据的平均值/标准偏差,或者单独计算 27 个组中的每一个?

1个回答

您可以在 0 和 1 之间的值中独立地对每个标准进行归一化,而无需考虑其他标准,它对于大多数分类方法 k-最近邻、随机森林、神经网络等会更好。

X一世,j*=X一世,j-Xj一世nXj一种X-Xj一世n