1、能映射到 【0,1】之间表示概率值的激活函数有那么多,现造也能造出来,为啥是 sigmoid :)
2、如果激活函数是这种形式,那 0 这个位置便是固定的。当我们的输出值大于 0 时,p > 0.5,小于 0 时,p < 0.5。这里关键点在于 0 这个位置,是不是不一定是这个位置最好,有没有一个可学习的参数 w,类似于 1/(1+e^-(x+w)),这样的形式,让 sigmoid 可以左右移动,而不局限于 0 这个位置?如果没有,那又是为啥?
3、进行二分类时,不一定说是 p>=0.5 是一类,p <= 0.5 是一类吧。可不可以是 p >= 0.8 是一类,p <= 0.8 是一类(0.8 也可以是其他值)?