请稍等 ...

关于timesteps长度和lstm nodes数的疑惑

首先，很感谢卢老师的课程，在这学到了不少。但这几天在学LSTM网络时有个问题一致困扰我。我一致觉得lstm nodes数应该和time steps的长度一致，但从老师的课程中看貌似并不是这样。拿老师的文本分类为例，原来我一直以为LSTM网络模型中，每个time steps有50个token经过embedding后生成了（5016）的输入矩阵。而每个LSTM处理单元接受一个（116）的向量进行计算，然后将状态值传递给下一个LSTM单元，就像是普通的RNN网络一样，这样的话LSTM层就需要50个LSTM处理单元。但老师的代码中明显不是这样的，代码中的LSTM层都只有32个LSTM单元。我想一定是我对整个LSTM模型理解不透彻。特向老师请教。难道是每一个token生成的（116）的向量传递给LSTM层，而每一个这样的（116）的向量都会经过32次的LSTM单元的循环处理，再传递给fc层，生成梯度方向更新后，模型才会接受下一个token的（1*16）的向量进行计算？

迪FREE 2018-11-16 10:36:32

源自：7-14 计算图实现

2330

收起

提交取消

1回答

正十七回答被采纳获得+3积分 2018-11-18 23:52:29

你最后的“难道×××”的理解是对的。Lstm也是一种RNN，RNN中，不同time steps上的网络结构是共享的。对于每一步，你都可以把它类比成一张图像输入到一个卷积神经网络中去。上一步计算完成后才可以计算下一步。就是RNN这种特性的优势才使得它可以处理不同长度的数据的。

1 回复有任何疑惑可以回复我~

提问者迪FREE #1
```
非常感谢！
```
回复有任何疑惑可以回复我~ 2018-11-20 12:37:28

相似问题

老师可以解释下num_lstm_nodes的含义吗

请问老师,seq2seq模型怎么把输入的不定长句子转化成定长的向量啊？

老师，关于求数组长度的问题

关于维度问题的疑问

关于数据长度不对的疑问

登录后可查看更多问答，登录/注册

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

参与学习 2617 人
解答问题 935 个

深度学习算法工程师必学，深入理解深度学习核心算法CNN RNN GAN

了解课程

本课精华内容

问答

有些问题

2.1k 9

老师，我之前在jupyter上是可以正常运行的，后面就报警告和错误了，您看看下面的图

2.2k 8

（已放弃）win10 cuda9.2 cudnn7.2.1 tensflow_GPU 1.10.0 程序意外结束

1.7k 7

为什么0的概率就是激活函数的输出呢？

1.7k 7

激活函数和归一化的问题

2.5k 7

查看更多本课问答

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号