我通常会看到在输入的所有通道上执行卷积。例如一个内核真的是一个输入的内核通道,从而导致每个滤波器有一个输出通道。
如果您要对单个通道或通道对进行卷积,每个通道使用独立的过滤器,会发生什么?我想知道当某些通道不相关时,您是否可以通过将某些层的通道分开来防止某些信息丢失?
我通常会看到在输入的所有通道上执行卷积。例如一个内核真的是一个输入的内核通道,从而导致每个滤波器有一个输出通道。
如果您要对单个通道或通道对进行卷积,每个通道使用独立的过滤器,会发生什么?我想知道当某些通道不相关时,您是否可以通过将某些层的通道分开来防止某些信息丢失?
您提到的技术称为“深度可分离卷积”,它依赖于空间和深度信息可以解耦的想法。它的主要优点是,与标准卷积相比,由于它不需要在所有通道上执行卷积,因此它的连接数要少得多(因此参数更少),从而产生更轻的模型。
谷歌有一种名为“Xception”(“Inception 的极端版本”)的架构,它使用这种卷积层的一个版本,并产生接近于最先进的结果。在Towards Data Science上有一篇非常好的评论。
就我个人而言,我不喜欢将渠道解耦的想法,因为我认为它让我们获得了一个不那么“复杂”的模型,但它似乎有效,所以我该判断谁?