大语言模型微调的数据构造

第11章 【后训练】有监督微调

围绕有监督微调展开。先说明预训练与后训练的关系,接着介绍指令理解技术模型微调 SFT,包括其评估方法、数据构造方式,如思维链构造模型逻辑推理能力。还会介绍模型微调的软件框架,最后通过实战利用 Deepseek 思维链数据训练模型的推理能力。
11-4 大语言模型微调的数据构造
购买后可查看完整视频

AI大模型算法-从大模型原理剖析到训练(微调)落地实战

  • 难度 进阶
  • 时长 50小时
  • 人数 232
  • 评分 100%

AI大模型训练:从大模型原理剖析到微调落地实战

详细了解此课程
讲师
Dream哥
算法工程师
毕业于华中科技大学,曾就职高通、平安,具有多年实战和教学经验。主研大语言模型、机器人对话系统、搜索的落地应用。
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号