(1)知识图谱概论与技术架构:了解知识图谱的起源与发展历程(从经典人工智能知识工程到语义Web,再到现代知识图谱)。理解知识图谱的核心价值(语义搜索、智能问答、推荐计算、大数据分析)和知识图谱分类(通用知识图谱与领域知识图谱)。掌握知识图谱的整体技术架构,从底层图数据库到D2R/NL2R数据入图再到图谱消费应用的全流程。
(2)知识表示方法与OWL本体建模:理解知识表示的核心概念,学习人工智能历史发展中的知识表示方法(产生式表示、框架表示、语义网络)。掌握知识图谱的符号表示方法(RDF、RDFS、OWL本体语言),学习知识图谱的向量表示方法(TransE等知识表示学习模型)。深入理解本体(Ontology)的核心概念(类、属性、关系、约束),掌握使用Protégé工具构建OWL本体的完整流程,包括类层次结构设计、对象/数据属性定义、限制条件添加和公理设置。理解开放世界假设与封闭世界假设的区别,掌握必要条件和充分条件的建模技巧。
(3)知识图谱全生命周期管理:掌握知识图谱生命周期的核心概念,从知识建模、知识获取、知识融合、知识存储、知识计算到知识应用的全流程。理解各阶段所需解决的相关问题与技术难点,建立知识图谱项目的系统工程观。
(4)知识抽取:实体识别与关系抽取:学习非结构化文本中的知识抽取技术。掌握实体识别(命名实体识别、细粒度实体识别)的方法,学习关系抽取(限定域关系抽取、开放域关系抽取)的实现。掌握基于深度学习的关系抽取主流模型(SPO抽取模型),包括基于序列标注的SPO模型设计和基于意图识别+槽位抽取的SPO模型设计。了解概念抽取和事件识别与抽取技术。
(5)领域短语挖掘与同义词挖掘:掌握领域短语挖掘的算法和统计指标,学习同义词挖掘和缩略词抽取的实现方法。理解实体消歧的核心问题(同名实体区分),掌握基于聚类的实体消歧方法和基于链接的实体消歧方法,学习实体链接技术将文本中的提及映射到知识库中的目标实体。
(6)知识融合与实体对齐:理解知识图谱融合的必要性和挑战。掌握概念层融合技术(本体匹配/本体对齐),学习实例层融合技术(实体对齐/实体匹配)的实现方法。了解知识融合技术的前沿发展,包括基于表示学习的实体对齐方法。
(7)知识图谱存储与查询:掌握基于关系型数据库的知识图谱存储方案(RDF三元组表、属性表)。学习基于原生图数据库(Neo4j、JanusGraph)的存储实现,理解原生图数据库的实现原理。掌握Cypher查询语言的使用方法,实现图谱数据的灵活检索。了解JanusGraph与Neo4j的对比及适用场景选择。
(8)知识图谱建模与可视化实战:使用图数据库完成知识建模表示,学习数据批量导入方法(D2R工具、Python操作Neo4j)。掌握知识图谱的可视化分析方法,实现图谱数据的直观展示和探索。
(9)知识图谱推理与计算:理解推理的基本概念和知识图谱推理的分类。掌握基于本体(Ontology)的推理和基于规则的推理。学习基于嵌入学习的知识图谱推理和基于规则学习的知识图谱推理。了解本体嵌入(Ontology Embedding)在概念层推理中的应用。掌握知识图谱的计算能力,包括图算法(PageRank、社区发现)的实现。
(10)知识图谱问答系统:了解智能问答系统的分类和知识图谱问答的应用场景。掌握基于查询模板的知识图谱问答、基于语义解析的问答方法、基于检索排序的问答方法和基于深度学习的知识图谱问答。实战完成基于知识图谱的医药问答系统或企业知识问答系统。
(11)知识图谱与大模型融合(RAG与GraphRAG):理解大模型与知识图谱结合的三大方向(知识图谱增强大模型、大模型增强知识图谱、知识增强的语言预训练)。掌握检索增强生成(RAG)的原理与优化方法,包括向量表征、混合搜索和RAG优化策略。学习GraphRAG的设计框架,掌握微软GraphRAG工具的应用。实践知识图谱与向量检索的混合搜索技术。
(12)综合项目实战:行业知识图谱系统开发:结合所学知识,完成一个完整的行业知识图谱项目(如金融风控知识图谱、医药疾病知识图谱、企业信息知识图谱等)。涵盖需求分析、本体设计、知识抽取、图数据库存储、查询接口开发和与大模型融合应用的全流程,形成规范的知识图谱项目报告。