课程培训
深度学习目标检测及视频分析应用培训


深度学习目标检测及视频分析应用培训大纲

  •  

  • 培训对象

  • 适合具备Python编程基础和基本深度学习概念,希望系统掌握目标检测核心算法及视频分析应用技术的算法工程师、计算机视觉工程师、AI应用开发者、科研人员及计算机相关专业学生。

  •  

  • 培训目标

  • 完成本课程后,学员将能够深入理解目标检测的主流算法(两阶段、单阶段、Transformer)原理与演进脉络,熟练掌握YOLO系列模型的实战应用与优化技巧,掌握多目标跟踪(MOT)的核心算法(SORT/DeepSORT/BYTETrack)及其与检测的协同工作,具备构建完整视频分析系统的能力(检测+跟踪+行为识别),能够独立解决智能监控、流量统计、违规检测等实际业务场景问题

  •  

  • 培训内容


  • (1)目标检测概述与评价体系:了解目标检测的发展历程、核心任务和应用场景(智能安防、自动驾驶、工业质检、新零售)。掌握目标检测的完整评价体系:交并比(IoU)的计算与应用、非极大值抑制(NMS)的原理、准确率与召回率的平衡、mAP(mean Average Precision)的计算方法
    。学习目标检测面临的挑战:小目标检测、遮挡处理、实时性要求、多尺度问题。

    (2)两阶段目标检测算法:深入理解两阶段检测器的核心思想(先提议后分类)。掌握R-CNN系列检测器的演进脉络:R-CNN的候选区域方法、Fast R-CNN的感兴趣区域池化(RoI Pooling)、Faster R-CNN的区域提议网络(RPN)端到端训练。理解锚框(Anchor Box)的概念、设计策略(尺度、长宽比)和匹配规则(正负样本分配)。学习Mask R-CNN在检测基础上扩展实例分割的原理

    (3)单阶段目标检测算法:掌握单阶段检测器的核心思想(一次前向直接预测位置和类别),理解其相对于两阶段检测器的速度优势。学习SSD(Single Shot MultiBox Detector)的多尺度特征图预测策略。深入理解YOLO系列检测器的技术演进:从YOLOv1的回归思想到YOLOv8/v10的完整技术体系,包括无锚框检测、解耦头、动态标签分配等核心创新。对比分析单阶段与两阶段检测器的适用场景选择。

    (4)YOLO系列实战与优化:掌握YOLOv5/v8/v10的完整实战流程,包括环境配置、数据集准备(标注格式转换、数据集划分)、模型训练与验证。学习YOLO模型的核心配置参数理解(网络深度、宽度、训练超参数)。掌握模型优化技巧:数据增强策略(Mosaic、MixUp、Copy-Paste)、学习率调度、权重衰减设置。实战完成自定义数据集(如口罩检测、交通标志识别)的模型训练与调优

    (5)基于Transformer的目标检测:了解Transformer在计算机视觉领域的应用演进。掌握DETR(Detection Transformer)的核心思想:将目标检测视为集合预测问题,去除锚框和NMS等人工设计组件。学习Deformable DETR的改进(可变形注意力机制加速收敛)。了解Swin Transformer在检测中的应用及其层次化架构特点。对比CNN与Transformer检测器的性能与适用场景。

    (6)视频分析与目标跟踪基础:理解视频分析与单张图像分析的本质区别(时间维度信息的引入)。掌握视频分析的核心任务:目标检测、多目标跟踪、行为识别、视频语义理解。了解目标跟踪的任务分类:单目标跟踪(SOT)与多目标跟踪(MOT)的区别与应用场景。学习跟踪系统的完整工作流程:检测、特征提取、数据关联、轨迹管理

    (7)多目标跟踪算法:SORT与DeepSORT:深入理解SORT(Simple Online and Realtime Tracking)的核心思想:卡尔曼滤波预测目标状态、匈牙利算法进行数据关联。掌握DeepSORT的改进:引入外观特征(Re-ID特征)解决遮挡下的身份切换问题。学习级联匹配策略优先匹配高置信度轨迹。实战实现基于检测结果的DeepSORT多目标跟踪

    (8)多目标跟踪算法:BYTETrack与BoT-SORT:掌握BYTETrack的核心创新:利用高置信度检测框和低置信度检测框的两阶段关联策略,有效处理遮挡和模糊场景。学习BoT-SORT的改进:融合运动预测和外观特征,使用相机运动补偿提升跟踪稳定性。了解不同跟踪算法的适用场景选择:拥挤场景优先BYTETrack,不可预测运动优先BoT-SORT。实战实现BYTETrack在监控视频中的应用。

    (9)视频行为识别与分析:理解行为识别的任务定义:从视频序列中识别目标的动作类别(跑步、跳跃、打架等)。掌握经典行为识别算法:双流网络(空间流+时间流)、3D卷积网络(C3D、I3D)。学习SlowFast算法的核心思想:慢路径捕捉空间语义信息,快路径捕捉时间运动信息,通过侧向连接融合时空特征。了解行为识别与目标检测、多目标跟踪的协同工作:先检测再识别

    (10)视频分析系统实战:检测+跟踪+识别:学习构建完整的视频分析系统,整合目标检测(YOLO)、多目标跟踪(DeepSORT/BYTETrack)和行为识别(SlowFast)模块。掌握视频流处理框架设计:视频帧读取、检测线程、跟踪线程、识别线程的协同与异步处理。实战实现交通监控场景下的车辆检测、跟踪与违章行为识别(如违停检测、逆行检测)

    (11)模型部署与边缘端优化:掌握视频分析模型的部署技术。学习模型转换(ONNX/TensorRT)和推理加速(FP16/INT8量化)。了解边缘端部署方案:树莓派、Jetson Nano等嵌入式平台的YOLO部署实践。掌握推理性能优化技巧:批处理、异步推理、预处理合并。实战完成视频分析模型在边缘设备的部署与实时推理

    (12)综合项目实战:智能视频分析系统开发:结合所学知识,完成一个完整的视频分析项目(如智能安防监控系统、交通流量统计平台、工厂行为规范检测系统)。涵盖需求分析、数据采集与标注、检测模型训练、跟踪算法集成、行为识别模块开发、系统集成与部署、效果评估的全流程,形成规范的视频分析应用项目报告。





如果您想学习本课程,请预约报名
如果没找到合适的课程或有特殊培训需求,请订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表点击在线申请

服务特点:
海量专家资源,精准匹配相关行业,相关项目专家,针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示,快捷高效,省时省力省钱。

专家力量:
中国科学院软件研究所,计算研究所高级研究人员
oracle,微软,vmware,MSC,Ansys,candence,Altium,达索等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享
针对客户实际需求,案例教学,互动式沟通,学有所获
报名表下载
联系我们 更多>>

咨询电话010-62883247

                4007991916

咨询邮箱:soft@info-soft.cn  

 

  微信咨询

随时听讲课

聚焦技术实践

订制培训 更多>>