请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

transformer不收敛

老师,我用transformer做文本分类,收敛速度极其的慢,基本不收敛,这是为什么

正在回答 回答被采纳积分+3

插入代码

1回答

正十七 2021-11-25 10:07:18

可以考虑用lm的方式预训练一下,再在文本分类任务上fine-tune。如果收敛太慢或者不收敛,原因应该是模型太复杂,而监督信号太少(只有一个类别loss)

0 回复 有任何疑惑可以回复我~
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号