K-Means 聚类分析图和数据标准化

数据挖掘 r 聚类 无监督学习 k-均值 正常化
2022-03-08 17:25:33

我是 k-means 聚类的新手,我正在从事一个关于密码分析的项目。我有几个问题,我希望在这里得到一些帮助。

  1. 我有四个变量,我的变量数据值范围可以从 -100% 到 100%(截至目前,我目前使用的数据范围是 -40% 到 5%),我还需要对数据进行归一化吗?如果是,我是否使用 z-score 标准化?
  2. 如果我对资产市值中的数据进行了标准化,我该怎么做?

  3. 通常,在示例中,k-means 聚类在 2 个变量上运行,您可以在 x 轴和 y 轴上绘制聚类。在这种情况下,我有 4 个变量如何在图表中绘制集群?

  4. 我试图用 4 个集群运行 k-means 并绘制 2 个剖面图:第一个图)。我的数据在运行 k-means 之前没有标准化,第二个图)我的数据在运行 k-means 之前都是 z-score 标准化。第二个图看起来不对,因为集群 2 和 4 看起来像一条直线,而在我进行 z 分数标准化后,两个剖面图看起来非常不同。有人得到任何建议吗?

    • 第一个图(无归一化)

在此处输入图像描述

  • 第二个图(Z 分数归一化)

在此处输入图像描述

0个回答
没有发现任何回复~