采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
上面使用 deepseek-v3.2模型,分词结果中文丢失了,使用 deepseek-v3 版本也是一样的,我看老师你讲课过程中是直接能够输出结果的,是我这边缺少了什么设置吗? 环境信息: transformers=5.3.0 Python=3.12.13
text = "你好,这是一个Token计算示例。Hello World!" result = tokenizer.encode(text) result [14907, 19923, 21133, 3] 这个结果明显是不对的
登录后可查看更多问答,登录/注册
AI大模型训练:从大模型原理剖析到微调落地实战
15 3
99 3
94 3
146 3
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号