围绕有监督微调展开。先说明预训练与后训练的关系，接着介绍指令理解技术模型微调 SFT，包括其评估方法、数据构造方式，如思维链构造模型逻辑推理能力。还会介绍模型微调的软件框架，最后通过实战利用 Deepseek 思维链数据训练模型的推理能力。

11-4 大语言模型微调的数据构造

AI大模型算法-从大模型原理剖析到训练(微调)落地实战

AI大模型训练：从大模型原理剖析到微调落地实战

详细了解此课程

讲师

Dream哥

算法工程师

毕业于华中科技大学，曾就职高通、平安，具有多年实战和教学经验。主研大语言模型、机器人对话系统、搜索的落地应用。

热搜