需要帮助理解这个卷积神经网络的结构

数据挖掘 机器学习 卷积神经网络
2022-03-14 11:05:37

我试图掌握这个复杂的神经网络的结构。

图片

来源

我知道第一层是一个 6x6 卷积,步幅为 2,然后是 3x3 最大池,然后是 6 个 5x5 卷积和另一个 3x3 最大池。然而,在此之后,来自 64 个神经元的完全连接层的输出“平铺在 pool2 响应图的特殊维度上”。

我不明白这是什么意思。pool2 的输出应该是 64 个(因为有 64 个过滤器)18x18 数组。在第一个 18x18 数组中,我是否将 output1 添加到每个 18*18=324 值中,并在第二个数组中添加 output2 到每个 324 值,等等?

TLDR

我如何处理 64 个输出(每个都是 18x18 数组)和全连接层的 64 个输出?

1个回答

所谓电机指令vt(我不知道这是什么意思,但它看起来是一些标量特征,尽管如果它是一个向量,它的工作原理是一样的)被输入一个层,该层构建这个值的 64 个表示,一个用于卷积层中的每个特征图我们也将添加它。然而,conv 层具有空间分辨率,并且该表示只是相应特征图的一个数字。他们所做的是平铺这个数字,以便整个电机命令表示具有与卷积层(pool2)之后的最大池化层相同的尺寸。现在尺寸匹配了,我们可以使用逐元素加法操作将此信息注入卷积网络。