请稍等 ...

请问老师，embedding层的训练是如何进行的呢？

使用预训练的embedding层，trainable = False，这个好理解。
如果想从自己的语料训练一个embedding，那么是
a) 先彻底完成embedding层的训练（skip-gram），将此层固定下来后，继续训练剩余层。还是
b）embedding层也是与其他层一样，是根据最终的loss来更新的。

我觉得应该是a) 合理些，求教老师解答。

谢谢！

OliverSong 2019-09-05 23:09:57

源自：7-3 数据padding、模型构建与训练

2587

收起

提交取消

1回答

正十七回答被采纳获得+3积分 2019-10-01 01:19:18

应该是b，之前大家都用word2vec或者自行训练embedding，然后再保持embedding不变去训练网络其他部分。但是后来通用的做法就是一块训练，因为效果好。

0 回复有任何疑惑可以回复我~

收起回答

船长will #1
```
end-to-end 方法带来的性能瓶颈不会很大么？
```
回复有任何疑惑可以回复我~ 2019-10-31 17:19:58

正十七回复船长will #2

train的时候会慢，inference的时候直接用embedding应该跟word2vec没有区别。然后train的时候慢就上分布式GPU/TPU环境训练，性能问题可以解决。

回复有任何疑惑可以回复我~ 2019-10-31 23:24:42

船长will 回复正十七 #3
```
谢谢老师
```
回复有任何疑惑可以回复我~ 2019-10-31 23:25:28

相似问题

能不能直接用训练第一层的数据集训练第二层？

使用预训练的word2vec，之后训练embedding层。

SSD目标检测算法在kitti数据集上训练效果不佳

请问代码训练好了如何具体实战？

请教老师如果评论数据每天有增加，是不是每天都要搞个训练这个论评？

登录后可查看更多问答，登录/注册

Google老师亲授 TensorFlow2.0 入门到进阶

参与学习 1849 人
解答问题 896 个

Tensorflow2.0实战—以实战促理论的方式学习深度学习

了解课程

本课精华内容

问答

如何确定神经网络的层数以及每一层的神经元数目？

3.2k 1

tensorflow如何进行超参数搜索呢？

1.8k 3

老师我运行那个第二章第一个程序的第二段出现下面的问题时咋回事啊

1.6k 19

使用函数式API训练wide and deep模型出错

1.7k 13

RuntimeError: 。。does not set or modifies parameter layer_size

2.5k 7

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

请问老师，embedding层的训练是如何进行的呢？

正在回答

1回答

相似问题