我很难找到 LDA 的两个看似不相关的部分之间的相关性。
我从几个视频中了解到的是:
有一个文档生成“部分”,它是两个狄利克雷分布的构造,一个描述文档到主题的分布,一个描述主题到单词的分布。
有 Gibbs 采样优化“部分”,它接收其单词已分配给主题的文档,并且在每次优化迭代中,Gibbs 采样朝着文档到主题和单词到主题的某种一元分布迈出了一步,即每个文档的单词或多或少属于同一个主题,文档语料库中的每个单词实例或多或少属于一个主题。
我的问题是为什么需要第一部分?我认为它的重要性可能在于主题的初始随机分配需要来自狄利克雷分布,但我不确定是否是这种情况。
有什么我想念的吗?