数据挖掘 - 卷积层中的通道 - 吾爱随笔录

数据挖掘机器学习神经网络美国有线电视新闻网卷积核心

2022-02-17 00:04:55

我通常会看到在输入的所有通道上执行卷积。例如一个 $3x3$ 内核真的是一个 $3x3xN$ 输入的内核 $N$ 通道，从而导致每个滤波器有一个输出通道。

如果您要对单个通道或通道对进行卷积，每个通道使用独立的过滤器，会发生什么？我想知道当某些通道不相关时，您是否可以通过将某些层的通道分开来防止某些信息丢失？

1个回答

您提到的技术称为“深度可分离卷积”，它依赖于空间和深度信息可以解耦的想法。它的主要优点是，与标准卷积相比，由于它不需要在所有通道上执行卷积，因此它的连接数要少得多（因此参数更少），从而产生更轻的模型。

谷歌有一种名为“Xception”（“Inception 的极端版本”）的架构，它使用这种卷积层的一个版本，并产生接近于最先进的结果。在Towards Data Science上有一篇非常好的评论。

就我个人而言，我不喜欢将渠道解耦的想法，因为我认为它让我们获得了一个不那么“复杂”的模型，但它似乎有效，所以我该判断谁？

其它你可能感兴趣的问题