如何判断高斯混合是否是多峰的

机器算法验证 高斯混合分布
2022-04-13 13:25:11

假设我混合了高斯分布,并且我知道每个单独的高斯分布的均值和方差。我如何判断得到的分布是否是多峰的,或者更具体地说,是否存在与混合物中高斯数相等的模式数?我看到有一些公式可以在两个高斯混合的情况下回答这个问题,但我找不到任何与更一般情况相关的文献。如果这有任何相关性,我只需要处理一维高斯。

2个回答

Miguel Carrera-Perpinan 有一个关于此主题的网页以及相关软件。这并不能直接解决您的问题,但表明

  1. 个分量的一维高斯混合个模式;kk
  2. 个分量的一维非高斯混合可能具有多于个模式;kk
  3. 个分量的多维混合可能有超过个模式。kk

在一维高斯中,如果方差足够小(相对于其他方差)并且权重足够大(相对于其他权重),则组件将诱导接近其均值的模式。这可能会建议一种特定的数值方法来检查模式,方法是更改​​一个分量的方差,直到模式在分量均值附近出现或消失。

显然,从每个正态平均值开始运行 EM 算法应该表明该组件是否会导致局部模式。

否则,您可能总是遵循拉里·瓦瑟曼的建议:“混合物,如龙舌兰酒,本质上是邪恶的,应该不惜一切代价避免。”

我怀疑你会找到一个明确的解决方案。模式的数量是密度函数的一阶导数的根数 - 这很混乱 - 我很确定你找不到明确的解决方案。