请稍等 ...

为什么在20个全连接层后再dropout，而不是每个全连接层后来一个dropout

为什么在20个全连接层后再dropout，而不是每个全连接层后来一个dropout,就像BatchNormalization那样呢？

Layer (type) Output Shape Param #

flatten (Flatten) (None, 784) 0

dense (Dense) (None, 100) 78500

dense_1 (Dense) (None, 100) 10100

dense_2 (Dense) (None, 100) 10100

dense_3 (Dense) (None, 100) 10100

dense_4 (Dense) (None, 100) 10100

dense_5 (Dense) (None, 100) 10100

dense_6 (Dense) (None, 100) 10100

dense_7 (Dense) (None, 100) 10100

dense_8 (Dense) (None, 100) 10100

dense_9 (Dense) (None, 100) 10100

dense_10 (Dense) (None, 100) 10100

dense_11 (Dense) (None, 100) 10100

dense_12 (Dense) (None, 100) 10100

dense_13 (Dense) (None, 100) 10100

dense_14 (Dense) (None, 100) 10100

dense_15 (Dense) (None, 100) 10100

dense_16 (Dense) (None, 100) 10100

dense_17 (Dense) (None, 100) 10100

dense_18 (Dense) (None, 100) 10100

dense_19 (Dense) (None, 100) 10100

alpha_dropout (AlphaDropout (None, 100) 0
)

dense_20 (Dense) (None, 10) 1010

=================================================================
Total params: 271,410
Trainable params: 271,410
Non-trainable params: 0

慕粉2125289011 2022-06-26 14:02:15

源自：2-10 实战批归一化、激活函数、dropout

548

收起

提交取消

1回答

正十七回答被采纳获得+3积分 2022-07-07 21:58:22

可以每层都接dropout，这里只是展示了一种使用的方法。一般来说，如果dropout层较多，有可能会导致模型难训练，所以如果你每层都加dropout，dropout rate不要设的太大。

你可以试试每层都加，看看效果如何。

1 回复有任何疑惑可以回复我~

收起回答

提问者慕粉2125289011 #1
```
非常感谢！
```
回复有任何疑惑可以回复我~ 2022-07-10 17:09:24

相似问题

老师，为什么在global_average_pooling2d_1层后面接全连接层效果反倒不好了？

AlexNet最后是连了两个全连接层么？

全连接层与隐藏层的区别

全连接层后面不能再加卷积层

为什么要是用两个全连接层，它们各是什么意思

登录后可查看更多问答，登录/注册

Google老师亲授 TensorFlow2.0 入门到进阶

参与学习 1849 人
解答问题 896 个

Tensorflow2.0实战—以实战促理论的方式学习深度学习

了解课程

本课精华内容

问答

如何确定神经网络的层数以及每一层的神经元数目？

2.6k 1

tensorflow如何进行超参数搜索呢？

1.1k 3

老师我运行那个第二章第一个程序的第二段出现下面的问题时咋回事啊

981 19

使用函数式API训练wide and deep模型出错

1.2k 13

RuntimeError: 。。does not set or modifies parameter layer_size

1.8k 7

查看更多本课问答

意见反馈帮助中心 APP下载

官方微信

为什么在20个全连接层后再dropout，而不是每个全连接层后来一个dropout

Layer (type) Output Shape Param #

正在回答

1回答

相似问题