自动化运维培训课程体系(选修)
专题划分
专题一:自动化运维基础与理念
专题二:Shell/Python脚本自动化
专题三:配置管理自动化(Ansible)
专题四:基础设施即代码(Terraform)
专题五:CI/CD流水线自动化
专题六:监控自动化与告警管理
专题七:日志自动化采集与分析
专题八:容器化运维自动化
专题九:云平台自动化运维
专题十:自动化运维平台与工具链
专题十一:自动化安全与合规
专题十二:自动化运维最佳实践与演进
专题一:自动化运维基础与理念
-
自动化运维定义与价值:效率提升、降低人为错误、标准化交付
-
自动化运维的发展历程:从脚本到平台、从手工到智能
-
自动化运维的适用场景:重复性任务、复杂流程、规模化环境
-
自动化成熟度模型:手工、脚本化、工具化、平台化、智能化
-
自动化运维的挑战与应对:技术债务、文化阻力、安全风险
-
自动化与DevOps、SRE的关系与协同
-
自动化工具分类:配置管理、CI/CD、监控、容器编排
-
自动化运维的ROI评估方法
-
自动化运维团队能力模型
-
自动化运维标准化建设:命名规范、目录规范、日志规范
-
自动化运维安全原则:最小权限、密钥管理、审计
-
案例解析:头部企业自动化运维体系架构
专题二:Shell/Python脚本自动化
-
Shell脚本基础:变量、条件判断、循环、函数
-
Shell脚本高级:正则表达式、sed/awk文本处理
-
Shell脚本调试技巧:set -x、shellcheck静态检查
-
Python运维开发环境搭建:虚拟环境、依赖管理
-
Python基础语法:数据类型、控制流、函数、模块
-
Python文件操作与异常处理
-
Python系统管理模块:os、sys、subprocess、shutil
-
Python网络请求:requests库、API调用
-
Python并行与异步执行:threading、multiprocessing、asyncio
-
Python日志模块:logging配置、日志轮转
-
Python配置管理:configparser、yaml、json解析
-
综合实战:编写自动化巡检脚本并生成报告
专题三:配置管理自动化(Ansible)
-
配置管理工具对比:Ansible、Puppet、Chef、SaltStack
-
Ansible架构与原理:无代理、SSH连接、模块化
-
Ansible安装与配置:Inventory、配置文件、模块
-
Ad-Hoc命令:批量执行、模块使用
-
Playbook基础:YAML语法、任务、变量、模板
-
Playbook进阶:条件判断、循环、角色、依赖
-
Ansible变量与事实:Facts获取、变量优先级
-
Ansible模板引擎:Jinja2语法、模板渲染
-
Ansible角色与复用:Role目录结构、依赖关系
-
Ansible Vault:加密敏感数据、密码管理
-
Ansible Tower/AWX:集中管理、权限控制、作业调度
-
综合实战:使用Ansible批量部署LNMP环境
专题四:基础设施即代码(Terraform)
-
IaC概念与价值:声明式、版本化、自动化
-
Terraform架构与原理:Provider、State、Plan、Apply
-
Terraform安装与配置:Provider配置、凭证管理
-
HCL语法基础:块、参数、表达式、变量
-
Terraform状态管理:本地状态、远程状态(Backend)
-
Terraform模块化:模块定义、模块复用、模块注册
-
Terraform工作流:init、plan、apply、destroy
-
多云基础设施编排:AWS、Azure、GCP、阿里云
-
Terraform与Ansible集成:Provisioner使用
-
Terraform最佳实践:状态隔离、版本控制、CI/CD集成
-
Terraform高级特性:count、for_each、动态块
-
综合实战:使用Terraform在云上创建VPC、ECS、RDS
专题五:CI/CD流水线自动化
-
CI/CD核心理念:持续集成、持续交付、持续部署
-
版本控制与分支策略:GitFlow、GitHub Flow、Trunk Based
-
GitLab CI/CD架构:Runner、Pipeline、Job、Stage
-
.gitlab-ci.yml配置:关键字、阶段、任务定义
-
Jenkins架构与部署:Master/Agent、插件管理
-
Jenkins Pipeline:声明式Pipeline、脚本式Pipeline
-
Jenkins共享库:复用流水线代码
-
CI/CD与容器集成:Docker构建、镜像推送
-
CI/CD与K8s集成:kubectl部署、Helm Chart
-
制品管理:Nexus、Harbor、Artifactory
-
CI/CD安全实践:密钥管理、镜像扫描、门禁控制
-
综合实战:基于GitLab CI构建Java应用CI/CD流水线
专题六:监控自动化与告警管理
-
监控自动化价值:自动发现、动态阈值、智能告警
-
Prometheus监控体系:服务发现、指标采集、PromQL
-
自动发现机制:基于文件、Consul、Kubernetes
-
告警规则自动化配置:基于模板、Git管理
-
Alertmanager配置:路由、抑制、静默、通知
-
监控仪表盘自动化:Grafana Dashboard as Code
-
告警自愈机制:Webhook触发自动化脚本
-
异常检测与预测:机器学习算法应用
-
告警噪声抑制:告警聚合、智能降噪
-
监控数据自动化运维:指标清理、存储策略
-
黑盒监控自动化:探针部署、外部探测
-
综合实战:Prometheus自动发现K8s目标并配置告警
专题七:日志自动化采集与分析
-
日志管理挑战:分散、异构、海量、实时
-
日志采集架构:Agent、聚合、传输
-
Filebeat配置:输入、输出、多行处理
-
Fluentd/Fluent Bit:插件体系、路由、过滤
-
Logstash管道:输入、过滤、输出插件
-
日志解析自动化:Grok模式、正则提取、JSON解析
-
日志集中存储:Elasticsearch集群、索引生命周期
-
日志分析可视化:Kibana仪表盘、搜索、告警
-
日志告警配置:ELK Alert、Elastalert
-
日志自动化运维:索引清理、冷热数据分层
-
容器日志采集:stdout/stderr、Pod日志
-
综合实战:部署EFK采集Nginx日志并配置告警
专题八:容器化运维自动化
-
容器化环境自动化挑战:动态性、规模化、复杂性
-
Dockerfile自动化构建:多阶段构建、基础镜像管理
-
Docker Compose自动化部署:环境变量、配置外部化
-
Kubernetes资源编排:YAML模板、Kustomize
-
Helm包管理:Chart结构、模板函数、依赖管理
-
Kubernetes Operator原理:自定义控制器、自动化运维
-
容器镜像自动化清理:镜像回收策略、Harbor清理
-
容器集群自动扩缩容:HPA、VPA、Cluster Autoscaler
-
容器平台自动巡检:OPA策略、安全性检查
-
容器网络自动化配置:NetworkPolicy、CNI配置
-
容器存储自动化管理:PVC自动创建、快照备份
-
综合实战:使用Helm部署应用并配置HPA自动伸缩
专题九:云平台自动化运维
-
云平台自动化价值:弹性、按需、API驱动
-
云资源自动化管理:通过API、CLI、SDK
-
云资源编排工具:Terraform、Pulumi、CloudFormation
-
云服务自动化配置:VPC、安全组、负载均衡
-
云数据库自动化管理:RDS自动创建、备份、扩缩容
-
云存储自动化:对象存储生命周期、权限策略
-
云监控自动化:云监控指标采集、告警配置
-
云成本自动化优化:资源调度、闲置资源回收
-
云安全自动化:IAM策略、审计日志、合规扫描
-
多云统一运维:资源抽象、统一API
-
云平台自愈能力:故障检测、自动恢复
-
综合实战:通过Terraform管理阿里云资源并集成监控
专题十:自动化运维平台与工具链
-
自动化运维平台设计理念:统一入口、流程编排、自助服务
-
CMDB与自动化联动:配置驱动、自动发现
-
作业平台设计:脚本库、任务编排、审批流
-
工单系统与自动化集成:自动执行、结果反馈
-
流程引擎(BPM)在运维中的应用
-
运维门户建设:服务目录、权限管理、计量计费
-
自动化工具链整合:API网关、统一认证
-
运维数据平台:数据采集、存储、分析、展示
-
自动化度量平台:效率指标、质量指标、成本指标
-
运维机器人:ChatOps、通知、交互式执行
-
开源自动化平台:Spug、OPSANY、WGCLOUD
-
综合实战:基于开源平台构建运维自动化门户
专题十一:自动化安全与合规
-
自动化带来的安全风险:权限失控、配置错误、密钥泄露
-
最小权限原则在自动化中的应用
-
密钥与凭证管理:Vault、KMS、Secrets Management
-
自动化脚本安全审计:代码扫描、敏感信息检测
-
自动化配置合规检查:Open Policy Agent、Gatekeeper
-
镜像与制品安全扫描:Trivy、Clair自动化集成
-
容器运行时安全自动化:Falco策略、告警响应
-
合规基线自动化扫描:CIS Benchmark、kube-bench
-
自动化应急响应:自动隔离、自动恢复
-
安全事件自动处置:SOAR(安全编排自动化与响应)
-
自动化合规报告生成
-
综合实战:配置Vault动态密钥并集成到CI/CD流水线
专题十二:自动化运维最佳实践与演进
-
自动化运维实施路线图:调研、试点、推广、优化
-
自动化项目成功关键因素:组织支持、文化培养、技能提升
-
自动化运维度量指标体系:自动化覆盖率、成功率、节省工时
-
自动化运维常见陷阱与规避:过度自动化、维护成本、单点故障
-
自动化运维文档与知识库建设
-
自动化运维团队协作模式:开发与运维融合
-
自动化运维与AI融合:AIOps、异常检测、根因分析
-
自动化运维演进趋势:无服务器、平台工程、数据驱动
-
自动化运维在信创环境下的实践
-
企业自动化运维成熟度评估模型
-
自动化运维案例复盘:某企业自动化转型之路
-
综合大作业:设计企业自动化运维三年演进规划
如果您想学习本课程,请
预约报名
如果没找到合适的课程或有特殊培训需求,请
订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表点击在线申请
服务特点:
海量专家资源,精准匹配相关行业,相关项目专家,针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示,快捷高效,省时省力省钱。
专家力量:
中国科学院软件研究所,计算研究所高级研究人员
oracle,微软,vmware,MSC,Ansys,candence,Altium,达索等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享
针对客户实际需求,案例教学,互动式沟通,学有所获