请稍等 ...

deepseek模型分词中文丢失

图片描述
上面使用 deepseek-v3.2模型，分词结果中文丢失了，使用 deepseek-v3 版本也是一样的，我看老师你讲课过程中是直接能够输出结果的，是我这边缺少了什么设置吗？
环境信息：
transformers=5.3.0
Python=3.12.13

BlueFish0702 4天前

源自：4-8 大模型的输出流程介绍

收起

提交取消

2回答

Dream哥 8小时前

看代码应该没有问题

0 回复有任何疑惑可以回复我~

收起回答

Dream哥 4天前

tokenize之后应该是ID才对呀？

0 回复有任何疑惑可以回复我~

收起回答

提问者 BlueFish0702 #1

text = "你好，这是一个Token计算示例。Hello World!"
result = tokenizer.encode(text)
result
[14907, 19923, 21133, 3]  

这个结果明显是不对的

回复有任何疑惑可以回复我~ 4天前

相似问题

我的想法: 模型越强大,越不需要写详细的提示词. 2. 前端提示词后端微调,最终目的让模型更专心 . 老师觉得呢

请教老师结巴分词能实现英文单词分词吗？

老师，有对接deepseek课程吗

新建分支，git pull之后本地代码丢失

prisma文件可以拆分多个模型文件吗

登录后可查看更多问答，登录/注册

AI大模型算法-从大模型原理剖析到训练(微调)落地实战

参与学习 226 人
解答问题 31 个

AI大模型训练：从大模型原理剖析到微调落地实战

了解课程

本课精华内容

问答

deepseek模型分词中文丢失

15 3

请问老师可以更新这部分代码吗

99 3

章节4.10的代码报错

94 3

手撸LayerNorm代码部分听不懂

146 3

请问这里的字典的长度初始化为什么需要减去1？

146 3

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

deepseek模型分词中文丢失

正在回答回答被采纳积分+3

2回答

相似问题