我有一组自变量,我正在使用 Python 中的 Pearson Correlation Coefficient 计算它们之间的相关矩阵。矩阵的一部分如下所示:
从这个矩阵中,假设我想找出变量 NoOfDoors 和其余变量之间的强相关分量(符号...压缩比)。我采用的过程是我取了该列的平均值(计算为 0.039604),基于此,我只考虑了那些大于 0.039604 的值。
基于此,以下变量被选择为强相关:
(制造、吸气、轴距、长度、宽度、高度、整备质量、发动机类型、缸径、压缩比)
我想问一下,这个选择对吗?如果是,那么有没有一种有效的方法来做到这一点?如果没有,正确的方法是什么?由于我是该领域的新手,因此将不胜感激。谢谢!
