变分自动编码器中的潜在变量图

数据挖掘 深度学习 喀拉斯 自动编码器 vae
2022-03-07 02:27:41

我遵循了这个关于自动编码器的Keras 文档指南。

在文档的末尾有潜在变量 z 的图表:
在此处输入图像描述

但是我无法理解以及如何解释情节,以及随着模型的超参数的变化,情节应该如何变化?

1个回答

正如 Nikos 在评论中所说,这是一张显示潜在变量空间中不同类别(数字)的图表。

首先要说一句:从可视化设计的角度来看,我认为作者为类使用颜色渐变是错​​误的,它应该是每个数字完全不同的颜色:这里的数字是一个分类变量,那里它们之间没有秩序的概念。这是误导性的,因为图表的读者自然会期望梯度中有一些逻辑,但没有。

空间本身是不可解释的,因为 X 和 Y 上的值没有意义(对于人类)。但是,该图可以告诉您的是两个类的接近程度或可区分性:理想情况下,不同的类彼此之间相当不同,这意味着该模型成功地将它们分开。

不幸的是,由于我上面提到的错误,很难在此图中清楚地看到事物,但如果我正确地看到颜色,则可以观察到一些事情:

  • 1 是右上角的大紫色东西,它与其他大部分不同。
  • 0 是左上角较小的深紫色组,也很明显。

其他数字相互混合得更多,很难看到任何东西:

  • 显然 9(黄色)在中心到处散布,中间有很多点 7(我认为?):这意味着模型有时可能会混淆 7 和 9(这是有道理的:手写的 7和 9 可以具有相同的形状)。
  • 6 似乎是最接近 0 的比较薄的绿色东西,我可以想象这两者具有相似的形状。

我的眼睛不是很好,所以也许我犯了一些错误,但我希望你能看到这个想法。

基本上,不同的类/颜色在图表上分离得越多,模型就越好,所以你应该能够看到一些非常好的超参数和一些非常差的超参数之间的一些差异。但是依赖图表是没有意义的:一个好的旧评估度量(或混淆矩阵)要准确得多。