在特征相关性的背景下,我试图理解相关性方法对特征选择的意义。如果出现以下相关系数的结果,有人可以解释一下,那么我应该采用该特征吗?规则是选择 corrcoeff 值大于 0.5 的特征。如有错误请指正。我计算的方式是使用 Matlab 的corrcoeff(target,feature)wheretarget和featureare 向量
Case1 : corrcoeff 返回 NaN 值 --
Nan Nan
Nan 1
由于值大于 0.5,是否应该选择特征?
Case2:corrcoeff 返回 0 个值
0 0
0 1
在这种情况下,我应该拒绝该功能。
案例3:
-0.3 0
0 -0.3
负相关但绝对值小于 0.5,因此拒绝该特征
案例4:如果根本没有线性关系怎么办,在这种情况下corrcoeff将不起作用。我如何知道是否存在线性关系,在这种情况下如何进行特征选择;还有其他功能或技术吗?