请稍等 ...

tanh和relu的区别

我在学习的过程中发现有时用keras训练时候会出现每次迭代正确率都在0.01左右，loss为nan的情况，网上说这种现象叫做梯度爆炸，并给出了一点建议“如果数据集是图片，那么得转化为float 也就是/255，同时relu和softmax两层不要连着用，最好将relu改成tanh,”。我试验后发现确实有效果，所以我就想问问这个tanh和relu的区别是什么？

慕斯1347104 2020-01-02 14:36:21

源自：1-9 Google_cloud_gpu_tensorflow配置

1761

收起

提交取消

1回答

正十七回答被采纳获得+3积分 2020-01-02 21:49:19

其实你试试把learning rate调成0.001也可以收敛。

relu和tanh的区别在于计算方式不同：

tanh是一个输出为[-1, 1]的单调递增函数，可以参考，https://baike.baidu.com/item/%E5%8F%8C%E6%9B%B2%E6%AD%A3%E5%88%87/3194837?fromtitle=tanh&fromid=19711736

relu就是负数输出0,正数原值输出的函数，https://zh.wikipedia.org/wiki/%E7%BA%BF%E6%80%A7%E6%95%B4%E6%B5%81%E5%87%BD%E6%95%B0

relu的优势是计算快，tanh中需要计算指数，会慢，但是输出的均值是0, 比较有利于梯度的回传。

至于softmax前不要用relu，是一个有用的技巧，但不是严格的约定。

0 回复有任何疑惑可以回复我~

提问者慕斯1347104 #1
```
非常感谢！
```
回复有任何疑惑可以回复我~ 2020-01-14 17:02:12

相似问题

Sigmoid对比ReLU

关于relu和leakyrelu的问题

Flutter中get关键字和普通的方法有什么区别

老师，突然有个疑惑！input_shape = (28,28)和input_shape = [28,28]区别是什么？

koa与express有啥大区别

登录后可查看更多问答，登录/注册

Google老师亲授 TensorFlow2.0 入门到进阶

参与学习 1849 人
解答问题 896 个

Tensorflow2.0实战—以实战促理论的方式学习深度学习

了解课程

本课精华内容

问答

如何确定神经网络的层数以及每一层的神经元数目？

3.2k 1

tensorflow如何进行超参数搜索呢？

1.8k 3

老师我运行那个第二章第一个程序的第二段出现下面的问题时咋回事啊

1.7k 19

使用函数式API训练wide and deep模型出错

1.8k 13

RuntimeError: 。。does not set or modifies parameter layer_size

2.6k 7

查看更多本课问答

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号