采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师,这里为什么要将emdeding后的x和context_vector连接后输入GRU而不是直接把context_vector作为GRU的输入呢??
同学你好,这个问题针对的是seq2seq + attention模型吧。
在这里,因为context_vector是原语言信息,而x是目标语言上一步的信息,在decoder的lstm中,还有隐含状态是目标语言的已经翻译出来词语的信息。
综上,这里把context vector和x拼起来再输入的原因是decoder在这一步不仅需要知道源语言的信息,还需要知道什么信息已经翻译出来了。
非常感谢!
登录后可查看更多问答,登录/注册
Tensorflow2.0实战—以实战促理论的方式学习深度学习
3.3k 1
1.9k 3
1.7k 19
1.8k 13
2.6k 7
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号