我有按不同标准分为 27 组的数据。这些分组的原因是为了表明每个组都有不同的行为。但是,我想将所有内容标准化为相同的规模。例如,我想标准化为 0-100 的 0-1 比例,这样我可以说类似百分位数,并且在各组之间具有相同的含义。如果我只是说,通过减去每个的平均值并除以标准偏差来单独标准化每个,这会工作吗?我是否必须计算所有组合数据的平均值/标准偏差,或者单独计算 27 个组中的每一个?
标准化来自不同组的数据
数据挖掘
Python
熊猫
正常化
通过...分组
2022-03-12 17:18:34
1个回答
您可以在 0 和 1 之间的值中独立地对每个标准进行归一化,而无需考虑其他标准,它对于大多数分类方法 k-最近邻、随机森林、神经网络等会更好。
其它你可能感兴趣的问题