mlp中全连接层为什么使用relu而输出层使用softmax?-慕课网

1回答

flare_zhao 回答被采纳获得+3积分 2020-02-28 18:47:19

同学你好，

在mlp的内部结构中，很多时候会使用relu替代sigmoid，一个重要原因就是使用sigmoid，对模型求解的时候会存在梯度消失问题。其实mlp里面的损失函数并不是完成不变的，随着我们对模型认识的加深，会根据实际需要去调整和尝试不同的激活函数。

http://coding.imooc.com/learn/questiondetail/169447.html

关于很多时候使用relu，我在课程这里里有一个详细的答疑。

2/3.sofmax通常都是用在输出层的。中间层我们一般都希望只有一个输出结果作为当前神经元的输出。中间层的激活函数一般有：sigmoid relue leaky-rely tanh

补充：

在mlp中，新神经元的输出可以理解为，前面很多个神经元信号经过激活函数处理后的结果。这个激活函数是可以调整的，二分类任务，最后的激活函数使用sigmoid很适用，类似于逻辑回归。但如果是多分类，而且结果是多类别中的某一个（比如结果是4类中的一类，我们可以理解为这四个类别发生的概率之和为1），那我们可以使用softmax，通过这个激活函数运算，输出为每个类别可能的概率，最大的概率那个，就是本次预测的类别。

2 回复有任何疑惑可以回复我~

收起回答

mlp中全连接层为什么使用relu而输出层使用softmax?

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

元宵节快乐

pandas读取文件时应该把文件放在哪里？

课程亮点

Sigmoid对比ReLU

训练模型时训练进度为unknown

【学习任务】贵州茅台股价预测

【讨论题】关于股票预测得思考

【讨论题】基础的CNN模型设计

【学习任务】Fashion_mnist服饰分类

【讨论题】逻辑回归模型与神经网络模型的关系

热搜

最近搜索清空