(1)医药大模型概述与技术演进:了解大模型技术的发展历程及其在医药行业的应用价值。掌握从符号主义到深度学习的技术演进史,揭示大模型技术爆发的历史必然性。系统学习医学大模型的核心技术架构,对比通用大模型与医疗垂直大模型的差异与选型策略。分析大模型在医疗领域面临的机遇与挑战,包括数据隐私、可解释性、伦理合规等核心问题。
(2)Transformer架构与医学文本处理:深入解析Transformer架构的核心技术逻辑,详细介绍自注意力机制、位置编码和多头注意力机制等结构的原理。掌握医学文本数据的预处理技术,包括电子病历、临床报告、医学文献、药品说明书等多源异构文本的清洗与结构化方法。学习医学实体识别、关系抽取、知识表示等关键技术,构建医学文本的向量化表示。
(3)医学大模型微调与优化技术:掌握大模型微调的核心方法,对比全参数微调与参数高效微调(LoRA、QLoRA、Adapter)的适用场景。学习如何通过针对性优化预训练模型,显著提升大模型在垂直领域的任务表现。实践医学领域的指令微调技术,构建符合临床需求的对话模型。掌握强化学习(RLHF)在医学大模型对齐中的应用。
(4)医学知识增强与RAG技术:理解检索增强生成(RAG)在医学领域解决知识时效性和幻觉问题的核心价值。学习医学知识库的构建方法,整合临床指南、医学教材、药品信息、病历数据等多源知识。掌握医学文档的分块策略、向量化嵌入与混合检索优化技术。实践基于RAG的医学问答系统开发,实现精准的医学知识检索与生成。
(5)医学图像大模型与多模态应用:了解视觉大模型在医学影像分析中的应用,学习CNN与Transformer在医学图像识别中的融合方法。掌握医学图像报告自动生成的实现技术,包括胸部X光、CT、MRI等影像的自动描述与报告生成。学习多模态医学大模型的架构设计,实现影像-文本联合表示与跨模态检索。
(6)AI药物发现与分子生成:了解大模型在药物研发全链条中的应用,包括靶点发现、分子生成、ADMET性质预测、虚拟筛选等。学习使用AlphaFold等蛋白质结构预测工具,理解其在药物设计中的价值。掌握基于生成式AI的分子设计与优化技术,使用BioNeMo、KNIME等平台进行分子毒性预测与性质优化。
(7)临床决策支持与智能问诊:掌握基于大模型的临床决策支持系统设计方法。学习构建智能问诊系统,实现症状采集、疾病预测、诊疗建议生成。理解临床指南与医学知识的融合策略,确保决策建议的准确性与合规性。实践开发专科疾病管理大模型(如肿瘤、肾病、儿童肥胖等)的构建与应用。
(8)生物医学数据分析与课题设计:运用大模型辅助生信课题设计,通过对大量生信文献的快速梳理,精准提炼数据分析方向。学习借助大模型挖掘生信多组学数据的研究热点,把握领域前沿动态。掌握利用大模型辅助修改数据分析代码、整理转录组、代谢组、蛋白质等多组学数据分析流程的方法。实践基于TCGA、GEO等公共数据库的AI辅助数据挖掘与课题设计。
(9)医学智能体与工作流搭建:学习构建面向医学场景的智能体(Agent)系统,掌握智能体的感知-规划-记忆-执行核心架构。使用扣子(Coze)等平台搭建医学工作流,整合AI工具与科研资源,实现高效协同。通过案例演示,学习如何运用智能体优化实验设计、数据采集分析、成果转化等科研环节。实践构建面向特定医学任务的智能体应用。
(10)医学大模型部署与算力优化:掌握大模型的本地化部署技术,学习使用Ollama、vLLM、Llama Factory等工具进行模型量化与加速推理。了解昇腾、鲲鹏等国产算力平台的配置与使用方法。学习混合精度训练、梯度累积、分布式训练等优化技巧,在有限算力资源下实现大模型的高效训练与部署。
(11)医学大模型评估与合规:掌握医学大模型的多维度评估体系,包括医学问答准确率、临床指南遵从度、诊断建议安全性等核心指标。学习医学AI产品的监管要求与合规路径,了解《生成式人工智能服务管理办法》在医疗领域的应用。掌握医学大模型的可解释性技术,确保AI决策过程的透明性与可信度。
(12)综合项目实战:结合所学知识,完成一个完整的医药行业大模型应用项目(如智能问诊系统、医学知识问答助手、药物研发辅助平台、临床科研课题设计工具)。涵盖需求分析、数据处理、模型微调、知识增强、智能体集成、部署优化的全流程,形成规范的医学大模型应用项目报告。