1、老师这个单步训练的decoder是怎么保证上一时间步的状态能够传到下一时间步的
2、这个decoder的output, state = self.gru(x)为什么不像encoderoutput, state = self.gru(x, initial_state = hidden)一样设置initial_state = hidden参数呢,decoder不需要状态的初始化吗
3、以下理解是否正确
对于
keras.layers.SimpleRNN
我这样理解,不调用fit函数时RNN单元中的state永远会在下一个时间步传入该RNN单元作为状态输入,但当调用fit函数时,当完成了一个batch的(假如有n个时间步)n次循环后,进入下一个batch前,此时会自动调用model.reset_states()来重新初始化状态,若在keras.layers.SimpleRNN设置了stateful = True参数后,就不会有在完成了一个batch后,进入下一个batch前,自动调用model.reset_states()来重新初始化状态这一操作了