lstm的第一步输入-慕课网

3回答

静以修身666 回答被采纳获得+3积分 2019-12-13 17:26:52

个人鄙见，输出是[embedding_img, a, b, c, d]，输出是[a, b, c, d, e]，是因为LSTM正向传播是分步训练的，每一步输入后得到的是下一步（timesteps+=1）的输出。另一方面，LSTM需要保证输入矩阵和输出矩阵的大小一致。如果我说明白了，请采纳，谢谢！

1 回复有任何疑惑可以回复我~

收起回答

提问者慕粉9315168 #1
```
非常感谢！
```
回复有任何疑惑可以回复我~ 2019-12-27 15:11:56

正十七 2019-12-15 15:21:50

1,2可以看“静以修身666”同学的回答。

3. 是代码中显示的这样，被截断的句子最后不是eos。句子代表的就是句子末，所以如果长度足够，没有必要放eos。

4. 在这里我们是做了整合，把图片的embedding跟word的embedding放在了一起。对于一次训练。我们的输入是

[img_embedding, word_a_embedding, word_b_embedding, ...]，然后要预测的是[word_a_embedding, word_b_embedding, word_c_embedding, ...]，我们在训练的时候是多个timesteps一起训练的。

2 回复有任何疑惑可以回复我~

收起回答

提问者慕粉9315168 2019-12-11 14:19:07

请问老师~~

0 回复有任何疑惑可以回复我~

收起回答

lstm的第一步输入

正在回答

3回答

相似问题

请选择置顶位置

本课精华内容

有些问题

老师，我之前在jupyter上是可以正常运行的，后面就报警告和错误了，您看看下面的图

（已放弃）win10 cuda9.2 cudnn7.2.1 tensflow_GPU 1.10.0 程序意外结束

为什么0的概率就是激活函数的输出呢？

激活函数和归一化的问题

热搜

最近搜索清空

lstm的第一步输入

正在回答

3回答

相似问题

请选择置顶位置

本课精华内容

有些问题

老师，我之前在jupyter上是可以正常运行的，后面就报警告和错误了，您看看下面的图

（已放弃）win10 cuda9.2 cudnn7.2.1 tensflow_GPU 1.10.0 程序意外结束

为什么0的概率就是激活函数的输出呢？

激活函数和归一化的问题