请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

baseline documents 入库,提示buffer size 太大,13.35G

![图片描述](https://img1.sycdn.imooc.com/szimg/7a6f166709ffd72618720620.jpg)

是不是表格数据:

<table><caption>伙食补助费参考以下标准:</caption>\n<tr><td  >地区</td><td  >伙食补助费标准</td></tr>\n<tr><t...

向量化时候有什么异常???
我用的是mac m1的机器, device是cpu;
把documents切片后正常:documents = documents[1:36],正常, 36后面的是表格数据,documents = documents[1:39]就会一直运行中,不切片会报错 buffer size 太大,13.35G

正在回答

1回答

问题中,图片显示不全。你用的向量模型是哪个?和课程中一样的吗?

 

1. 如果怀疑是向量化异常,可以尝试验证下手动将表格数据,直接向量化看看是不是可以正常转换为embedding(利用第三章向量模型)

model_path = './data/llm_app/embedding_models/gte-large-zh'
model = SentenceTransformer(model_path)
embeddings = model.encode(["表格的文本"])


2. 同时可以观察下机器的负载情况

0 回复 有任何疑惑可以回复我~
  • 提问者 慕莱坞5350593 #1
    用的 bge-m3 ,刚才换成gte-large-zh可以了,谢谢老师的解答
    回复 有任何疑惑可以回复我~ 2025-04-17 10:40:09
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号