PCA 在频域有什么优势或用途吗?

机器算法验证 分类 主成分分析 信号处理
2022-04-05 23:39:16

我的问题是关于在频域中使用 PCA 分析信号。

  • 由于频率分析为信号处理提供了强大的工具,主成分分析 (PCA) 在频域中是否有任何“众所周知”的优势或用途?
  • 是否可以说 PCA 正在做一种“频率分析”,因为主成分代表了信号中最重要的频率?
4个回答

在频域中使用 PCA 的优点是通过利用特定周期的信号之间的互相关来选择一组权重。例如,(取决于应用领域)所研究的变量的行为在短期、中期和长期可能会有所不同。在频域中使用 PCA 将允许根据频率选择权重。

PCA 在时域和频域中的区别可以从特征值的计算方式来理解。在时域中,使用相关矩阵。在频域中,使用相关矩阵或谱密度矩阵的傅里叶变换来计算特征值。

对于在频域中使用 PCA 的技术应用,在 Jolliffe,IT(2002), Principal Component Analysis, 2nd Edition 的书中有描述。这是相关页面的链接。

关于您的第二个问题,我已经将 PCA 本身理解为一种查找变量组合的方法,这些变量组合通过最大化主成分的方差来提取数据中的最大信息。因此,它似乎没有处理数据中的任何循环或频率信息。

Li 和 Prakash 在最近的 ICML 上有一篇论文。它是关于一个复杂的线性动力系统,它原来是一个模型,其中傅里叶变换和 PCA 是特例。看看时间序列集群:复杂更简单

如果您接受光谱作为频域:PCA 在那里被大量使用。例如,关于主成分分析和光谱学的公开搜索会产生超过 2500 个结果。另一方面,光谱学家很少关注时域(傅立叶变换光谱确实使用空间域作为“中间”,但对于数据分析,通常使用和解释频率/波长/波数域)。

如果您在频域中进行 PCA,第一台 PC 将告诉您哪些频率对数据集中的方差贡献最大,而且哪些频率一起变化(具有正相关或负相关):它们最终在同一台 PC 中或彼此独立(最终在不同的 PC 中)。这是否与大多数贡献频率一致取决于您的数据是否/位于何处(根据其性质或居中)。

我想说 PCA 是否应该在时域或频域中完成取决于对这些域的解释。

  • 如果您想找到同时发生的事情或发生相同事情的时间,那么时域应该是合适的。
  • 如果您想查找以相同频率发生的事情或发生相同事情的频率,则使用频域。

主成分分析 (PCA) 是一种数学过程,它使用正交变换将可能相关变量的一组观察值转换为一组称为主成分的不相关变量值。这种变换是这样定义的,即第一个主成分具有尽可能高的方差(即,尽可能多地解释数据中的可变性),并且每个后续成分依次具有以下可能的最高方差它与前面的组件正交(不相关)的约束。只有当数据集是联合正态分布时,才能保证主成分是独立的。我对频率分析或信号处理知之甚少。但是PCA在这个领域有应用。检查文献.