请稍等 ...

baseline documents 入库，提示buffer size 太大，13.35G

![图片描述](https://img1.sycdn.imooc.com/szimg/7a6f166709ffd72618720620.jpg)

是不是表格数据:

<table><caption>伙食补助费参考以下标准：</caption>\n<tr><td  >地区</td><td  >伙食补助费标准</td></tr>\n<tr><t...

向量化时候有什么异常？？？
我用的是mac m1的机器, device是cpu；
把documents切片后正常：documents = documents[1:36],正常， 36后面的是表格数据，documents = documents[1:39]就会一直运行中，不切片会报错 buffer size 太大，13.35G

慕莱坞5350593 2025-04-17 00:32:32

源自：7-6 实战：实现制度问答模块RAG baseline

222

收起

提交取消

1回答

阿基米口回答被采纳获得+3积分 2025-04-17 09:25:43

问题中，图片显示不全。你用的向量模型是哪个？和课程中一样的吗？

1. 如果怀疑是向量化异常，可以尝试验证下手动将表格数据，直接向量化看看是不是可以正常转换为embedding（利用第三章向量模型）

model_path = './data/llm_app/embedding_models/gte-large-zh'
model = SentenceTransformer(model_path)
embeddings = model.encode(["表格的文本"])

2. 同时可以观察下机器的负载情况

0 回复有任何疑惑可以回复我~

收起回答

提问者慕莱坞5350593 #1
```
用的 bge-m3 ，刚才换成gte-large-zh可以了，谢谢老师的解答
```
回复有任何疑惑可以回复我~ 2025-04-17 10:40:09

相似问题

documents这个文件夹是不能复制吗？这是一个文件夹吗

Buffer提交

关于从 IoArgs 向 byte 中写入的问题

传递buffer太过累赘的疑问

输入z.cn 提示：“服务内部错误”

登录后可查看更多问答，登录/注册

RAG全栈技术从基础到精通，打造高精准AI应用

参与学习 486 人
解答问题 117 个

RAG全栈技术从基础到精通，打造高精准AI应用

了解课程

本课精华内容

问答

传参config时发送set_run_config错误

594 8

minicpm多卡部署

264 8

部署项目

444 7

deepdoc 如何单独使用

1.3k 7

三种方式跑出来的余弦相似度不一样

627 7

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

baseline documents 入库，提示buffer size 太大，13.35G

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

传参config时发送set_run_config错误

minicpm多卡部署

部署项目

deepdoc 如何单独使用

三种方式跑出来的余弦相似度不一样

热搜

最近搜索清空

baseline documents 入库，提示buffer size 太大，13.35G

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

传参config时发送set_run_config错误

minicpm多卡部署

部署项目

deepdoc 如何单独使用

三种方式跑出来的余弦相似度不一样