采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师您好,我想问一下关于我理解的多层感知器是否正确。
多层感知器是不是就是使用了多层感知器的模型架构,然后用比如课程中的例子中那样的图片数据来训练模型,最终得到分类。然后其中模型中又实用了逻辑回归类似的表达式和函数来模拟神经网络?是这么理解的吗?
还有就是老师您能稍微讲一下它的原理?为什么通过这个模型架构就可以实现呢?
谢谢老师
多层感知器,也就是我们所说的神经网络,将很多的神经元组合在一起这样就可以进行更为复杂的判断,核心就是基于多层感知器的一个结构框架。为什么通过这样的叠加可以解决更为复杂的任务?我们举个例子:
假设y与x是非线性边界分类关系,而一个神经元可以实现f=sigmoid(ax+b)的线性边界运算,现在我们把两个神经元叠加在一起看看会发生什么:
神经元1:f1=sigmoid(a1*x+b1)
神经元2: f2=sigmoid(a2*f1+b2)
然后从x》f1>f2的过程就是:
f2=sigmoid(a2*f1+b2)=sigmoid(a2*sigmoid(a1*x+b1)+b2)
这个看起来有点复杂哈,但通过这样的变化,你会发现f2的分类边界是非线性的,也就是说通过这样的简单叠加就实现了更为复杂的分类。
实际的mlp结构还不仅仅是两个神经元叠加,而是更多,而且每个神经元的函数关系也不一定是sigmoid函数,因此可以实现复杂的推理
老师我还想再问一下,关于你说的f2的分类边界是非线性的问题。如果按照你写的的话,f2的分类边界图形相当于是一个sigmoid函数,是否因为他是sigmoid形状所以可以说是非线性呢? 麻烦老师解答一下
不是啊,边界不是由sigmoid决定的,而是那个线性函数,到两层sigmoid的话有一个就不是线性了
登录后可查看更多问答,登录/注册
人工智能基础全方位讲解,构建完整人工智能知识体系,带你入门AI
1.2k 5
4.0k 3
1.5k 1
2.3k 3
1.1k 11