请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

使用预训练的word2vec,之后训练embedding层。

这样训练之后,效果不如不训练embedding层效果好,这是为什么?

正在回答 回答被采纳积分+3

1回答

正十七 2019-07-06 13:28:15

可能的原因是learning rate太大,导致embedding从word2vec初始化的那个好状态经过训练后变成了一个差状态。一般fine-tune的时候要设置较小的学习率。

0 回复 有任何疑惑可以回复我~
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信