我正在阅读这篇关于infoGAN infoGAN_paper_link中互信息的论文,并且已经有了运行它的代码。我几乎发现它的代码很好而且很花哨,除了我有点不理解成本函数中的一些代码。因此,我查看了这篇论文以剖析它以便更好地理解,并遇到了一些我不理解的数学符号(下图)。我试图弄清楚的符号的用法是期望下标中的“〜”,“'”和“||” 使用符号。
这就是我认为符号的含义。
- 期望下标中的“~”:“~”左边的变量可以是来自“~”右边的任何连续值
- P(c'|x) 中“c”旁边的“'”:我不知道。我认为这些是衍生物的符号,但这对这个等式没有意义,所以它不是那个。
- “||”:我不确定。我只知道规范中使用了这些符号,但这里显然不是这种情况。
我试图弄清楚的实际代码是 PyTorch 中的。它是成本中的变分下限(互信息项)(不是上面屏幕截图中的公式)。但是,在进行变分下限公式的公式计算之前,我首先遇到了屏幕截图中的公式。
mutual_information_lower_bound = lambda c_true, mean, logvar: Normal(mean,logvar.exp()).log_prob(c_true).mean()
谢谢您的帮助!
