请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

知识图谱构建耗时过长

老师,您好,如图在通过9-2实验代码构建知识图谱耗时过长,预估超过10天,请问如何解决?

图片描述

正在回答 回答被采纳积分+3

1回答

阿基米口 2025-04-14 22:44:03

应该是neo4j入库比较慢,

特别neo4j是都部署在同一台机器上,这样会比较耗性能。正常会远程部署在其他机器,而且入库量比较大39w。

可以将graph操作耗时打印出来看看


如果机器性能不够,建议可以对入库量进行裁剪,不要入库那么多,优先跑完流程。


可以使用批量入库提高性能。

代码参见课程git:https://git.imooc.com/coding-920/RAG_full_stack_course_notebooks/src/master/notebook/ch9-1_rag_kg_db_online.ipynb


https://img1.sycdn.imooc.com/szimg/4b18bc6809218a0d12291036.jpg

0 回复 有任何疑惑可以回复我~
  • 提问者 晓宇5288 #1
    好的,谢谢老师,最近要准备面试了,请问rag和graph数据集的来源,我需要了解数据集构造
    回复 有任何疑惑可以回复我~ 2025-04-15 10:29:20
  • 阿基米口 回复 提问者 晓宇5288 #2
    你说的【数据集的来源】是指输入的文档的来源? 还有【数据集构造】= 数据集的构成?,请补充下
    回复 有任何疑惑可以回复我~ 2025-04-15 11:22:56
  • 提问者 晓宇5288 回复 阿基米口 #3
    回复 阿基米口:老师 想问 构成数据集输入文档的来源;如果不是现成的数据集,而是自己搜集的,是如何组装它的?
    回复 有任何疑惑可以回复我~ 2025-04-15 12:39:37
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号