请稍等 ...

关于随机梯度下降的问题

为什么与批量梯度下降相比，两者的梯度函数是不一样的，但最后却依然能够收敛到相同的结果？这背后的数学原理我不太了解。

js商博良 2020-07-19 20:50:58

源自：6-6 随机梯度下降法

1000

收起

提交取消

1回答

liuyubobobo 2020-07-19 23:22:32

首先，他们的函数的形式是一样的。只不过批量梯度下降法每次参考了所有样本的信息；而随机梯度下降法每次参考了一个样本的信息。

如果你的问题是，随机梯度下降法为什么会收敛？可以参考这里的讨论：https://coding.imooc.com/learn/questiondetail/98263.html

继续加油！：）

1 回复有任何疑惑可以回复我~

提问者 js商博良 #1

谢谢老师！的确，我需要的是收敛性的证明，以及收敛结果相等的证明(也许我有强迫症，底层数学原理一定要搞清楚)。但数学底子还是太差了，目前看关于证明SGD收敛性的论文还是很吃力，正在恶补数学。

by the way,老师的课程讲得非常棒！

回复有任何疑惑可以回复我~ 2020-07-19 23:44:59

liuyubobobo 回复提问者 js商博良 #2
```
感谢支持。继续加油！：）
```
回复有任何疑惑可以回复我~ 2020-07-19 23:52:47

相似问题

关于小批量梯度下降算法与改进之后的随机梯度下降算法

两种梯度下降法的速度比较

该怎么理解随机梯度必然会下降这个操作？

随机梯度下降法计算性能的疑问

随机梯度下降法

登录后可查看更多问答，登录/注册

Python3入门机器学习经典算法与应用

参与学习 5893 人
提交作业 275 份
解答问题 2454 个

Python3+sklearn，兼顾原理、算法底层实现和框架使用。

了解课程

本课精华内容

问答作业

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

2.7k 19

关于线性回归中归一化处理和不对归一化处理的问题

3.7k 17

数据归一化为什么有用？对归一化无法直观理解

3.1k 15

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

1.7k 15

学好具体算法和机器学习的实际应用之间有哪些距离？

1.6k 14

查看更多本课问答

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号