采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
比如一次丢进去20张图片训练,训练是不是就是为了找出可以得出最小损失的参数,这里的参数是什么的参数,是sigmoid的函数参数吗?这里不是很懂。
同学你好,新年快乐!
训练就是为了找出最小损失的参数。这点你理解的没错。
这里的模型是sigmoid(Wx+b), 其中,W和b是参数,x是输入,sigmoid是一种计算方式,即f(x) = 1/(1+ e^-x)。
老师还有个地方不明白,比如第一次丢入20张图片,那就是要求出使得20张图片的平均损失最小的参数。那下次再丢入20张图片,获取的最佳参数是怎么算的,是这次获取的最佳参数和上次20张图片的最佳参数的平均吗,这里不是很懂。
梯度下降,不是每次都找到最佳平均,而是每次向梯度的方向更新一下。比如,当前参数是w,在20张图像上算出来的梯度是w1,那么在这一步,w的更新就是w-lambda * w1. lambda是一个预设的值,比如0.001.
登录后可查看更多问答,登录/注册
深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN
1.5k 9
1.5k 8
1.0k 7
1.1k 7
1.9k 7