请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

句子编码化问题

第五章句子编码化中字典的定义、转换、训练主要有什么用,为什么要构建这个字典?

字典中四个参数各自表示什么意思?

句子和向量之间的转换是否指构建句子的词向量?为什么不用word2vec

希望老师详细说明一下,课程中听得不是特别明白,谢谢

正在回答 回答被采纳积分+3

1回答

Mr_Ricky 2018-08-19 20:09:13

您好,构建字典的目的是方便我们在后续对聊天机器人对话模型的处理以及在训练和测试时候的使用,因为我们在处理对话的时候,需要将问答对拆开,拆开后分别对问答对进行处理。不知道你说的字典中的四个参数是不是指的PAD、START、END、UNK这四个参数,实际上这四个参数是用来进行补位处理,word2vec实际上是词向量,而我们这个处理实际上是做句子的向量,所以你可以把这个看作为是我们自己来实现的一个简单的句子向量的操作。

后续的视频我会尽量的详细一点去解释下目录的内容,谢谢您的宝贵建议和意见。

0 回复 有任何疑惑可以回复我~
  • 提问者 慕勒6698465 #1
    “PAD、START、END、UNK这四个参数,实际上这四个参数是用来进行补位处理”,这句话是什么意思呢,什么是补位操作?
    回复 有任何疑惑可以回复我~ 2018-08-20 22:47:57
问题已解决,确定采纳
还有疑问,暂不采纳
NLP实践TensorFlow打造聊天机器人
  • 参与学习       673    人
  • 解答问题       281    个

解析自然语言处理( NLP )常用技术,从0搭建聊天机器人应用并部署上线,可用于毕设。

了解课程
意见反馈 帮助中心 APP下载
官方微信