请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

bn,激活,droupout,残差连接这几个的顺序是什么

我看了一些代码,在卷积和bert里面的顺序都不一样。这实在是晕了

正在回答 回答被采纳积分+3

插入代码

1回答

正十七 2019-10-20 22:42:55

同学你好,这几个的用法确实比较灵活,这里面的关键因素我觉得是bn,据我所知:

  1. bn和激活函数的顺序可以互换: https://www.zhihu.com/question/283715823

  2. bn和dropout一般不会同时用,因为dropout和bn都会改变方差。如果一定要用,需要在bn层后面使用dropout或者修改dropout的公式使之对方差敏感。因为bn的效果应该比较显著。

  3. 残差和bn,一般bn会用在残差块之内吧,可以参考论文《Exploring Normalization in Deep Residual Networks with Concatenated Rectified Linear Units》

0 回复 有任何疑惑可以回复我~
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号