采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
全连接层的w一般按照正态分布或者其他分布去初始化。b一般是用0初始化就可以。
卷积层的初始化也需要遵循一个分布的。它和全连接层一样可以遵循正态分布,也可以是其他的。每一层都可以自定义初始化方式。
登录后可查看更多问答,登录/注册
深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN
1.5k 9
1.6k 8
1.1k 7
1.2k 7
1.9k 7