我有一系列形状的图像。如果我将 conv3d 与 8 个具有空间范围且没有填充的内核一起应用,如何计算输出的形状。
如果下一层是最大池化,输出形状是什么?
我有一系列形状的图像。如果我将 conv3d 与 8 个具有空间范围且没有填充的内核一起应用,如何计算输出的形状。
如果下一层是最大池化,输出形状是什么?
卷积公式与 2D 相同,在CS231n 教程中有很好的描述:
...其中是输入体积大小,是感受野大小,是步幅,是边界上使用的零填充量。特别是,当和时,就像您的问题一样,它简化为
因此,如果您输入张量,忽略批量大小和,则输出张量大小将为。
池化层通常将每个空间维度减半。这对应于局部感受野大小F=(2, 2, 2)和步幅S=(2, 2, 2)。因此,输入张量将转换为。
但是您设置了 stride S=(1, 1, 1),它会将每个空间维度减少 1:。
最后一个维度没有改变。
PyTorch 的文档中对此进行了解释nn.Conv3d