数据挖掘 - 变分自动编码器中的潜在变量图 - 吾爱随笔录

数据挖掘深度学习喀拉斯自动编码器 vae

2022-03-07 02:27:41

我遵循了这个关于自动编码器的Keras 文档指南。

在文档的末尾有潜在变量 z 的图表：

但是我无法理解以及如何解释情节，以及随着模型的超参数的变化，情节应该如何变化？

1个回答

正如 Nikos 在评论中所说，这是一张显示潜在变量空间中不同类别（数字）的图表。

首先要说一句：从可视化设计的角度来看，我认为作者为类使用颜色渐变是错误的，它应该是每个数字完全不同的颜色：这里的数字是一个分类变量，那里它们之间没有秩序的概念。这是误导性的，因为图表的读者自然会期望梯度中有一些逻辑，但没有。

空间本身是不可解释的，因为 X 和 Y 上的值没有意义（对于人类）。但是，该图可以告诉您的是两个类的接近程度或可区分性：理想情况下，不同的类彼此之间相当不同，这意味着该模型成功地将它们分开。

不幸的是，由于我上面提到的错误，很难在此图中清楚地看到事物，但如果我正确地看到颜色，则可以观察到一些事情：

其他数字相互混合得更多，很难看到任何东西：

我的眼睛不是很好，所以也许我犯了一些错误，但我希望你能看到这个想法。

基本上，不同的类/颜色在图表上分离得越多，模型就越好，所以你应该能够看到一些非常好的超参数和一些非常差的超参数之间的一些差异。但是依赖图表是没有意义的：一个好的旧评估度量（或混淆矩阵）要准确得多。

其它你可能感兴趣的问题