t-SNE 和 PCA 和截断 SVD 的比较
数据挖掘
聚类
特征选择
主成分分析
降维
特纳
2022-03-07 14:44:40
1个回答
- PCA 和 truncate SVD 差别不大,因为它们基于相同的理论,即丢弃特征值较小的特征向量。正如这里提到的区别:
TruncatedSVD 与 PCA 非常相似,但不同之处在于它直接作用于样本矩阵而不是协方差矩阵。当从特征值中减去 的列(每个特征)均值时,结果矩阵上的截断 SVD 等效于 PCA。实际上,这意味着 TruncatedSVD 转换器接受 scipy.sparse 矩阵而不需要对其进行增密,因为即使对于中等大小的文档集合,增密也可能会填满内存。
- T-SNE 试图通过考虑样本的邻居来找到数据的底层结构。当数据结构是流形时,通过对相邻点进行优先级排序会带来优势。
- 此处描述了一种使用雷达图来理解图形集群含义的方法。从我的角度来看,我想说的是
- 预测标签欺诈/非欺诈的信息不在结构流形上
- 样本似乎是线性分离的,并且主要信息仅由两个特征给出。如果需要,您可以检查仅保留两个特征时保留了多少特征值能量
其它你可能感兴趣的问题
