




在学习任何新知识时,掌握正确的方法和避开常见的陷阱至关重要。本章为你精心准备了学习本课程的必备指南,帮助你快速上手,少走弯路。
本章带你分析大语言模型的现状和问题,引出RAG(检索增强生成)技术这一“新星”。我们会剖析RAG在企业大模型应用中的核心地位,通过对比分析,让你明白RAG的必要性。接着,详细讲解RAG的三大组件(大语言模型、知识库、检索)及其工作流程,带你领略其技术魅力。还会探讨RAG技术的发展阶段,强调技术栈的重要性,并分析企业对RAG人才的需求,以及本课程案例的需求分析、环境与技术架构。掌握这些,你就能紧跟AI的未来趋势
本章全面剖析大语言模型,助力学员从理论迈向实战。首先,讲解大模型的本质、技术演变及基本概念,涵盖架构和涌现能力。接着,盘点国内外主流大模型(开源与闭源),分析其技术栈,拓宽视野。针对不同设备,总结本地部署(GPU/CPU)和API调用方式及注意事项,提升应用灵活性。同时,从多维度讲解模型评价方法,指导挑选适合RAG应用的基础模型。最后,通过代码实现,演示本地调用和API调用操作,助力掌握企业级大模型开发技巧。本章为后续企业级案例开发筑牢基础,还分析了不同项目角色对AI大模型的了解差异,助力精准定位需求。
Embedding模型是RAG系统的关键组成部分,挑选合适的embedding模型对开发RAG应用至关重要。本章详细讲解embedding的概念及其在RAG系统中的关键作用,带你了解当前embedding模型背后的主流架构和训练方法。重点介绍主流中文embedding模型bge和gte,帮助你掌握它们的特性。在实际应用中,我们会提供可参考的评估基准,教你如何根据应用场景选择最佳embedding模型,并给出迭代方式。实战部分,还会实现多种embedding模型的加载与使用,为你的实际应用提供清晰指导。
企业文档经过embedding模型语义向量化后,如何存储和高效检索这些知识向量,是RAG系统的核心技术。本章介绍主流的向量数据库,分析企业对向量数据库的要求,重点对比chroma和milvus的特性及适用业务场景。更重要的是,讲解向量数据的基本操作,并探索向量数据库的索引优化技术,分析不同索引技术及适用场景。实战部分,详细介绍chroma和milvus的部署及实际操作,同时强调企业级应用对高可用性的要求。学完本章,你将掌握企业级向量数据库的选型与高效使用技巧。
知识库为RAG流程提供关键上下文信息,而高效准确地处理企业数据是构建知识库的核心。本章先介绍企业数据的复杂多样性,引出GIGO(垃圾输入,垃圾输出)原则,这是影响RAG系统性能的重要因素。接着,给出多种文档的解析方法,包括视觉解析方法。在解析文档后,详细讲解数据分块的重要性及递归文本分块、语义智能分块等具体方法。实战部分,实现制度问答模块的数据读取和切割。通过本章,你将学会如何高效处理企业复杂业务数据,为构建高质量的知识库奠定基础。
在前面章节的铺垫下,本章将构建一个完整的制度问答模块RAG baseline,涵盖知识库构建、查询、检索和生成。详细分析项目需求、各组件技术选型和总体架构设计,最后通过实战实现制度问答模块RAG。此外,还会分析AI应用开发与传统软件开发的区别,强调AI应用开发的特殊性,引导你转变思想,采用迭代思维开展AI应用开发。学完本章,你将掌握搭建制度问答RAG的基本流程和要点。
RAG系统构建完成后,如何判断其是否达到预期效果?评估至关重要!本章详细介绍RAG评估的标准和三大步骤,讲解具体的RAG评估框架ragas。实战部分,利用ragas评估制度问答模块RAG baseline。通过本章,你将学会如何科学评估RAG系统,找出问题并明确提升方向,让RAG系统更上一层楼。
检索是RAG系统的关键组成部分,关系到能否获取与用户问题相关的上下文信息。本章首先介绍不同RAG架构的演化及检索的两种形态。重点讲解14种提高RAG检索性能的增强技术,包括6种查询增强、3种多索引增强、2种检索后增强(rerank重排和fuse混合检索)、2种模块增强(迭代增强生成和self-RAG自适应增强)。实战中,针对制度问答模块RAG实现这些方法,并结合AI应用开发,讲解企业中良好的代码规范和代码管理。学完本章,你将大幅提升RAG系统的检索能力,使其性能更出色。
本章将知识图谱这种先进的知识组织方式引入RAG,构建基于知识图谱的GraphRAG。首先介绍知识图谱的三元组结构,并通过金融数据进行分析拆解。接着,讲解如何用图数据库存储和使用知识图谱数据,重点介绍neo4j图数据库及cypher图查询语言,并在实战中构建金融智库的图数据。通过对比传统RAG和GraphRAG,强调GraphRAG的特点,并实战构建基于金融智库的GraphRAG。最后,分享如何在AI应用开发快速发展的当下,进行自我学习,紧跟前沿技术。
本章引入Agent技术,让RAG系统更智能。首先介绍Agent的概念、技术和主流产品,重点讲解ReAct的Agent实现方式。基于此,实现一个针对多文档的RAG路由,使RAG系统能自动选择不同RAG文档,提升性能。通过本章,你将学会如何利用Agent技术增强RAG系统,实现自动切换不同信息源,让RAG应用更高效、更智能。
本章聚焦于实现前面开发的两个RAG模块——制度文档助手和金融智库的前端访问界面。介绍前端chatbot开发框架gradio,教你如何设计前端界面,并在实战中实现一个企业员工助手的RAG chatbot:erag。通过本章,你将掌握如何为RAG应用开发友好的前端界面,提升用户体验。
Embedding模型和大语言模型在向量检索和答案生成中起着关键作用,提升它们的性能是RAG优化的重要任务。本章讲解微调的概念及适用场景,重点介绍参数高效的微调方法LoRA,通过模型微调框架swift,详细讲解LoRA微调大语言模型的过程。同时,结合流行的Llamaindex,讲解微调embedding模型的具体方法。学完本章,你将掌握如何通过微调提升RAG系统的性能,让模型更贴合企业实际需求。
在本章,我们将通过思维导图的方式,详细梳理整个课程的知识点细节,帮你巩固所学内容。同时,针对RAG给出课程扩展,为你未来的学习和实践提供方向。最后,还会分享一些AI岗位面试的建议
选课、学习遇到问题?
扫码添加指导老师 1V1 帮助你!
添加后老师会第一时间解决你的问题