关于decoder中的QKV问题-慕课网

2回答

慕勒8140236 2021-09-16 23:22:33

个人理解Query翻译里面物理意义是
我稀罕你
Key是我爱你
Value是I love u

0 回复有任何疑惑可以回复我~

收起回答

正十七 2021-09-04 21:04:14

我们的decoderLayer的call函数实现如下：

    def call(self, x, encoding_outputs, training,
             decoder_mask, encoder_decoder_padding_mask):
        # decoder_mask: 由look_ahead_mask和decoder_padding_mask合并而来
        
        # x.shape: (batch_size, target_seq_len, d_model)
        # encoding_outputs.shape: (batch_size, input_seq_len, d_model)
        
        # attn1, out1.shape : (batch_size, target_seq_len, d_model)
        attn1, attn_weights1 = self.mha1(x, x, x, decoder_mask)
        attn1 = self.dropout1(attn1, training = training)
        out1 = self.layer_norm1(attn1 + x)        
        # attn2, out2.shape : (batch_size, target_seq_len, d_model)
        attn2, attn_weights2 = self.mha2(
            out1, encoding_outputs, encoding_outputs,
            encoder_decoder_padding_mask)
        attn2 = self.dropout2(attn2, training = training)
        out2 = self.layer_norm2(attn2 + out1)        
        # ffn_output, out3.shape: (batch_size, target_seq_len, d_model)
        ffn_output = self.ffn(out2)
        ffn_output = self.dropout3(ffn_output, training=training)
        out3 = self.layer_norm3(ffn_output + out2)        
        return out3, attn_weights1, attn_weights2

self.mha2中，out1是query，encoding_outputs是key和value啊。

query和key去计算attention权重，value去和权重做乘积。物理意义就是，对于decoder来说，每一步都去和encoder的所有输出去做关联度（attention权重）计算，然后用encoder每一步的输出用关联度加权，得到decoder这一步需要encoder里的那些信息。然后再做下一步的计算。

0 回复有任何疑惑可以回复我~

收起回答

关于decoder中的QKV问题

正在回答回答被采纳积分+3

2回答

相似问题

请选择置顶位置

本课精华内容

如何确定神经网络的层数以及每一层的神经元数目？

tensorflow如何进行超参数搜索呢？

老师我运行那个第二章第一个程序的第二段出现下面的问题时咋回事啊

使用函数式API训练wide and deep模型出错

RuntimeError: 。。does not set or modifies parameter layer_size

热搜

最近搜索清空