采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师,我用transformer做文本分类,收敛速度极其的慢,基本不收敛,这是为什么
可以考虑用lm的方式预训练一下,再在文本分类任务上fine-tune。如果收敛太慢或者不收敛,原因应该是模型太复杂,而监督信号太少(只有一个类别loss)
登录后可查看更多问答,登录/注册
Tensorflow2.0实战—以实战促理论的方式学习深度学习
3.0k 1
1.5k 3
1.3k 19
1.5k 13
2.1k 7
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号