请稍等 ...

为什么最后一层不使用非线性变换了？

3-4卷积网络这节前面，使用三个隐藏层的神经网络，隐藏层使用relu非线性函数计算，在最后输出dense(hidden3,10)，但是这里为什么不加非线性函数softmax了，在后面直接根据argmax(dense(hidden3,10))取得分类预测值，总感觉很奇怪。我之前以为使用sparse_softmax_cross_entropy可以自动更新y=onehot(y) 更新y_=softmax(y_)，但是测试了一下把y和y_拿回来打印出来发现是没有变的。

Suspendz 2020-01-12 17:41:34

源自：3-4 卷积神经网络实战

926

收起

提交取消

1回答

提问者 Suspendz 2020-01-13 15:11:15

不过考虑到softmax下面是个e的x次的加和值，分子是e的x次，是个单调函数。而x来自于上一层的relu因此要么是0要么是正数，那似乎看起来argmax(softmax(x))和argmax(x)就没什么区别了。。

0 回复有任何疑惑可以回复我~

相似问题

为什么老师只讲矩阵行变换而不提列变换呢？

最后一层LSTM为什么不用设置return_sequences=True

关于“线程不拥有资源”的问题

在xor这章中，这里为什么第一层激活函数用的relu

什么样的数据适合使用pca降维

登录后可查看更多问答，登录/注册

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

参与学习 2617 人
解答问题 935 个

深度学习算法工程师必学，深入理解深度学习核心算法CNN RNN GAN

了解课程

本课精华内容

问答

有些问题

1.6k 9

老师，我之前在jupyter上是可以正常运行的，后面就报警告和错误了，您看看下面的图

1.7k 8

（已放弃）win10 cuda9.2 cudnn7.2.1 tensflow_GPU 1.10.0 程序意外结束

1.2k 7

为什么0的概率就是激活函数的输出呢？

1.3k 7

激活函数和归一化的问题

2.1k 7

查看更多本课问答

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号