采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
本来方向导数之类都忘了,到网上找了一些文章,后来感觉似乎没必要硬扣,理解梯度是偏导数向量会计算应该足够了,硬扣又要花莫名其妙的时间。
梯度主要是提供一个下降来逼近到最小值点,所以应该大小不重要,所以不要太大,这样步长就太大了。
非常对!梯度的方向更重要!
最后那里, J的偏导 除以 2m ,相当于在各个维度上除以2m, 各个维度上的偏导的值会变小,但是 由于所有维度都放缩了2m 倍,所以梯度方向不变,从某种意义上理解 只是减小了 eta 学习率,这么理解对吗
对。实际上,即使这样,很多时候也会梯度的模过大。所以,完全可以每次对梯度做一遍标准化,求梯度的单位向量。我们只对梯度的方向感兴趣。
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.5k 19
3.4k 17
2.9k 15
1.6k 15
1.4k 14