请稍等 ...

问一下关于AdamOptimizer的两个问题

请问在AdamOptimizer中，是如何针对不同的损失函数进行求导，来梯度下降的呢？
还有就是在下面这段程序里是如何实现反向传播来更新参数的呢？
with tf.Session() as sess:
sess.run(init)
for i in range(train_steps):
batch_data, batch_labels = train_data.next_batch(batch_size)
loss_val, acc_val, _ = sess.run([loss, accuracy, train_op],
feed_dict={ x: batch_data,y: batch_labels})

会边缘ob的码农 2019-07-17 20:47:25

源自：3-4 卷积神经网络实战

545

收起

提交取消

1回答

正十七回答被采纳获得+3积分 2019-07-18 08:56:50

AdamOptimizer是利用反向传播去求导的，虽然遇到的损失函数不同，但所有的损失函数其实都是可以求导的，既然可以求导，那么就可以利用链式法则一步步求解下去。

在tensorflow中，求导的细节我们是可以不用关心的，但简单来说，它的原理是在tensorflow的图结构的每个节点上都建立一个求导节点，接收当前节点的输入和输出来为之求导。

代码中的求导是train_op来实现的，run了train_op就会发生求导和参数更新操作。

0 回复有任何疑惑可以回复我~

提问者会边缘ob的码农 #1

谢谢老师的解答，也就是说在tensorflow里是内置有求导的算法的，可以一步步拆分变量进行求导工作，然后把求导的任务下放到每个节点，在各个节点上分别进行梯度下降，而使用sess.run（train_op）则是来触发这一过程，对各层的参数进行更新

回复有任何疑惑可以回复我~ 2019-07-18 09:27:26

相似问题

关于这两个问题想问一下老师

新版本scikit-learn中，关于OvR与OvO的相关问题

关于context跟hooks的一个问题

关于xshell关闭的问题

老师，想问线性相关两个等价定义的问题。

登录后可查看更多问答，登录/注册

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

参与学习 2617 人
解答问题 935 个

深度学习算法工程师必学，深入理解深度学习核心算法CNN RNN GAN

了解课程

本课精华内容

问答

有些问题

2.0k 9

老师，我之前在jupyter上是可以正常运行的，后面就报警告和错误了，您看看下面的图

2.1k 8

（已放弃）win10 cuda9.2 cudnn7.2.1 tensflow_GPU 1.10.0 程序意外结束

1.5k 7

为什么0的概率就是激活函数的输出呢？

1.6k 7

激活函数和归一化的问题

2.5k 7

查看更多本课问答

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号