课程培训
大模型微调培训课程—— 专项技术深造

大模型微调培训课程—— 专项技术深造

 

一、培训对象

已有基础微调经验、希望深入掌握微调前沿技术与优化方法的算法工程师、研究员

 

二、培训目标

  1. 深入理解微调的理论边界与前沿进展

  2. 掌握RLHF、DPO、KTO等对齐技术的原理与实现

  3. 具备解决微调中的灾难性遗忘、数据稀缺、评估困难等核心难题的能力

  4. 能够设计并实施大规模微调实验,进行技术创新与优化

 

三、培训内容

1. 微调理论基础与前沿综述

  • 微调的理论视角:模型编辑、知识注入、表征空间对齐

  • 微调 vs. 上下文学习(ICL)的边界与融合

  • 2024-2026年微调领域重要论文解读

2. 参数高效微调(PEFT)深度解析

  • LoRA的数学原理与变体(DoRA、LoRA+、VeRA)

  • Adapter、Prefix Tuning、P-Tuning v2的机制对比

  • PEFT组合策略:多任务微调与混合适配器

3. RLHF 全流程实现

  • 奖励模型(Reward Model)的训练:数据标注、模型架构、训练技巧

  • 强化学习算法(PPO)在大模型微调中的实现

  • RLHF的挑战:稳定性、复现性、奖励 hacking

4. DPO 与替代对齐技术

  • DPO(直接偏好优化)的数学原理与代码实现

  • IPO、KTO、ORPO等对齐算法的对比与选型

  • 偏好数据的构建策略与质量评估

5. 灾难性遗忘的机制与缓解

  • 灾难性遗忘的度量方法

  • 正则化方法:EWC、L2、弹性权重固化

  • 重放机制与数据配比优化策略

  • 连续学习与增量微调的实践方案

6. 少样本微调与数据增强

  • 少样本场景下的微调策略

  • 数据增强技术:回译、指令扩写、对抗生成

  • 元学习与迁移学习在微调中的应用

7. 多模态大模型微调

  • 视觉-语言模型(VLM)的微调架构(LLaVA、Qwen-VL)

  • 多模态数据格式与对齐策略

  • 图文理解、视觉定位任务的微调实践

8. 长文本模型微调技术

  • 长文本模型架构(RoPE扩展、NTK、YaRN)

  • 长文本微调的数据构造与位置编码调整

  • 长上下文微调的训练效率优化

9. 微调中的可解释性与调试

  • 模型内部表征的可视化与探针分析

  • 微调过程中模型行为的归因分析

  • 调试技巧:梯度分析、激活异常检测

10. 微调评估的高级方法

  • 细粒度评估:知识能力、推理能力、安全性的分离评估

  • 对抗性评估与鲁棒性测试

  • 基于信息论的评估指标:互信息、不确定性量化

11. 大规模微调工程优化

  • 千亿级模型的微调策略(模型并行、流水线并行)

  • 显存优化技术:梯度检查点、激活重计算、ZeRO-Offload

  • 训练稳定性问题与解决方案(Loss尖峰、梯度爆炸)

12. 微调前沿探索与创新实践

  • 模型合并与模型插值(Model Merging、Model Soup)

  • 轻量级微调与边缘端部署

  • 微调与检索、工具调用的深度融合趋势





如果您想学习本课程,请预约报名
如果没找到合适的课程或有特殊培训需求,请订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表点击在线申请

服务特点:
海量专家资源,精准匹配相关行业,相关项目专家,针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示,快捷高效,省时省力省钱。

专家力量:
中国科学院软件研究所,计算研究所高级研究人员
oracle,微软,vmware,MSC,Ansys,candence,Altium,达索等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享
针对客户实际需求,案例教学,互动式沟通,学有所获
报名表下载
联系我们 更多>>

咨询电话010-62883247

                4007991916

咨询邮箱:soft@info-soft.cn  

 

  微信咨询

随时听讲课

聚焦技术实践

订制培训 更多>>