网络中包含大量具有 ReLU 激活函数的标准卷积层。
模型末端使用了 Global Average Pooling (全局平均池化) 层。
某些层的权重或激活值呈现出非常大的动态范围或非对称的分布。
网络中广泛使用了 BatchNorm (批量归一化) 层。
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题