我对初始架构和张量流术语中的塔的理解是,它们是神经网络模型的一部分,对于该模型,可以在反向传播的前向阶段和梯度计算阶段独立地进行单独的计算。我目前的理解是基于另一个 datascience.stackoverflow 帖子什么是塔?, https : //www.tensorflow.org/tutorials/deep_cnn 上的 tensorflow 文档和关于初始架构的博客文章https://pseudoprofound.wordpress.com/2016/08/28/notes-on-the-tensorflow-implementation-of -inception-v3/。
但是,当我在介绍部分“The Inception Hypothesis”中阅读 Xception 论文 ( https://arxiv.org/abs/1610.02357 ) 时,它谈到了平均池化塔。这是否意味着它将初始模块中的分支称为塔,即使不会在这些分支上执行独立的反向传播计算?