训练有素的 CNN 中的每层检测模式是如何绘制的?

数据挖掘 深度学习 可视化 卷积神经网络
2021-10-02 04:18:46

如果我的问题不清楚,我说的是在图像训练的卷积神经网络 (CNN) 的每一层中检测到的模式。以下图为例(由 Honglak Lee 提供)。我想我理解了这个概念:不同的层开始为不同的功能编码,而且复杂性越来越高。第一层编码边缘,中间层编码简单特征(例如鼻子、眼睛),后面的层编码整个面部。但是,我看不到图片中的每个模式与网络元素之间的等价性。模式类中的每个模式是否对应于该层的一个神经元?这些很酷的模式检测图片是如何绘制的?

在此处输入图像描述

1个回答

您发布的图像来自描述卷积受限玻尔兹曼机的基函数的图。

我在这篇ICML 论文(在付费墙后面,抱歉)和这篇博士论文中找到了它们,都是由 Andrew Ng 建议的 Honglak Lee 编写的。

严格来说,它们不是前馈卷积神经网络的可视化,这可能就是为什么你很难解释它们所描绘的内容。我自己对 RBM 的了解并不多,所以恐怕我无法帮助他们解释。

就 CNN 的可视化而言,有几种常见的方法。您可以直接可视化过滤器权重,查找最大程度地激活过滤器的输入图像,将激活绘制为图像遮挡的函数等。 此页面对技术进行了很好的总结,本文也可能有用。