课程培训
自动化运维培训课程体系(选修)

自动化运维培训课程体系(选修)

专题划分

专题一:自动化运维基础与理念
专题二:Shell/Python脚本自动化
专题三:配置管理自动化(Ansible)
专题四:基础设施即代码(Terraform)
专题五:CI/CD流水线自动化
专题六:监控自动化与告警管理
专题七:日志自动化采集与分析
专题八:容器化运维自动化
专题九:云平台自动化运维
专题十:自动化运维平台与工具链
专题十一:自动化安全与合规
专题十二:自动化运维最佳实践与演进


专题一:自动化运维基础与理念

  1. 自动化运维定义与价值:效率提升、降低人为错误、标准化交付

  2. 自动化运维的发展历程:从脚本到平台、从手工到智能

  3. 自动化运维的适用场景:重复性任务、复杂流程、规模化环境

  4. 自动化成熟度模型:手工、脚本化、工具化、平台化、智能化

  5. 自动化运维的挑战与应对:技术债务、文化阻力、安全风险

  6. 自动化与DevOps、SRE的关系与协同

  7. 自动化工具分类:配置管理、CI/CD、监控、容器编排

  8. 自动化运维的ROI评估方法

  9. 自动化运维团队能力模型

  10. 自动化运维标准化建设:命名规范、目录规范、日志规范

  11. 自动化运维安全原则:最小权限、密钥管理、审计

  12. 案例解析:头部企业自动化运维体系架构


专题二:Shell/Python脚本自动化

  1. Shell脚本基础:变量、条件判断、循环、函数

  2. Shell脚本高级:正则表达式、sed/awk文本处理

  3. Shell脚本调试技巧:set -x、shellcheck静态检查

  4. Python运维开发环境搭建:虚拟环境、依赖管理

  5. Python基础语法:数据类型、控制流、函数、模块

  6. Python文件操作与异常处理

  7. Python系统管理模块:os、sys、subprocess、shutil

  8. Python网络请求:requests库、API调用

  9. Python并行与异步执行:threading、multiprocessing、asyncio

  10. Python日志模块:logging配置、日志轮转

  11. Python配置管理:configparser、yaml、json解析

  12. 综合实战:编写自动化巡检脚本并生成报告


专题三:配置管理自动化(Ansible)

  1. 配置管理工具对比:Ansible、Puppet、Chef、SaltStack

  2. Ansible架构与原理:无代理、SSH连接、模块化

  3. Ansible安装与配置:Inventory、配置文件、模块

  4. Ad-Hoc命令:批量执行、模块使用

  5. Playbook基础:YAML语法、任务、变量、模板

  6. Playbook进阶:条件判断、循环、角色、依赖

  7. Ansible变量与事实:Facts获取、变量优先级

  8. Ansible模板引擎:Jinja2语法、模板渲染

  9. Ansible角色与复用:Role目录结构、依赖关系

  10. Ansible Vault:加密敏感数据、密码管理

  11. Ansible Tower/AWX:集中管理、权限控制、作业调度

  12. 综合实战:使用Ansible批量部署LNMP环境


专题四:基础设施即代码(Terraform)

  1. IaC概念与价值:声明式、版本化、自动化

  2. Terraform架构与原理:Provider、State、Plan、Apply

  3. Terraform安装与配置:Provider配置、凭证管理

  4. HCL语法基础:块、参数、表达式、变量

  5. Terraform状态管理:本地状态、远程状态(Backend)

  6. Terraform模块化:模块定义、模块复用、模块注册

  7. Terraform工作流:init、plan、apply、destroy

  8. 多云基础设施编排:AWS、Azure、GCP、阿里云

  9. Terraform与Ansible集成:Provisioner使用

  10. Terraform最佳实践:状态隔离、版本控制、CI/CD集成

  11. Terraform高级特性:count、for_each、动态块

  12. 综合实战:使用Terraform在云上创建VPC、ECS、RDS


专题五:CI/CD流水线自动化

  1. CI/CD核心理念:持续集成、持续交付、持续部署

  2. 版本控制与分支策略:GitFlow、GitHub Flow、Trunk Based

  3. GitLab CI/CD架构:Runner、Pipeline、Job、Stage

  4. .gitlab-ci.yml配置:关键字、阶段、任务定义

  5. Jenkins架构与部署:Master/Agent、插件管理

  6. Jenkins Pipeline:声明式Pipeline、脚本式Pipeline

  7. Jenkins共享库:复用流水线代码

  8. CI/CD与容器集成:Docker构建、镜像推送

  9. CI/CD与K8s集成:kubectl部署、Helm Chart

  10. 制品管理:Nexus、Harbor、Artifactory

  11. CI/CD安全实践:密钥管理、镜像扫描、门禁控制

  12. 综合实战:基于GitLab CI构建Java应用CI/CD流水线


专题六:监控自动化与告警管理

  1. 监控自动化价值:自动发现、动态阈值、智能告警

  2. Prometheus监控体系:服务发现、指标采集、PromQL

  3. 自动发现机制:基于文件、Consul、Kubernetes

  4. 告警规则自动化配置:基于模板、Git管理

  5. Alertmanager配置:路由、抑制、静默、通知

  6. 监控仪表盘自动化:Grafana Dashboard as Code

  7. 告警自愈机制:Webhook触发自动化脚本

  8. 异常检测与预测:机器学习算法应用

  9. 告警噪声抑制:告警聚合、智能降噪

  10. 监控数据自动化运维:指标清理、存储策略

  11. 黑盒监控自动化:探针部署、外部探测

  12. 综合实战:Prometheus自动发现K8s目标并配置告警


专题七:日志自动化采集与分析

  1. 日志管理挑战:分散、异构、海量、实时

  2. 日志采集架构:Agent、聚合、传输

  3. Filebeat配置:输入、输出、多行处理

  4. Fluentd/Fluent Bit:插件体系、路由、过滤

  5. Logstash管道:输入、过滤、输出插件

  6. 日志解析自动化:Grok模式、正则提取、JSON解析

  7. 日志集中存储:Elasticsearch集群、索引生命周期

  8. 日志分析可视化:Kibana仪表盘、搜索、告警

  9. 日志告警配置:ELK Alert、Elastalert

  10. 日志自动化运维:索引清理、冷热数据分层

  11. 容器日志采集:stdout/stderr、Pod日志

  12. 综合实战:部署EFK采集Nginx日志并配置告警


专题八:容器化运维自动化

  1. 容器化环境自动化挑战:动态性、规模化、复杂性

  2. Dockerfile自动化构建:多阶段构建、基础镜像管理

  3. Docker Compose自动化部署:环境变量、配置外部化

  4. Kubernetes资源编排:YAML模板、Kustomize

  5. Helm包管理:Chart结构、模板函数、依赖管理

  6. Kubernetes Operator原理:自定义控制器、自动化运维

  7. 容器镜像自动化清理:镜像回收策略、Harbor清理

  8. 容器集群自动扩缩容:HPA、VPA、Cluster Autoscaler

  9. 容器平台自动巡检:OPA策略、安全性检查

  10. 容器网络自动化配置:NetworkPolicy、CNI配置

  11. 容器存储自动化管理:PVC自动创建、快照备份

  12. 综合实战:使用Helm部署应用并配置HPA自动伸缩


专题九:云平台自动化运维

  1. 云平台自动化价值:弹性、按需、API驱动

  2. 云资源自动化管理:通过API、CLI、SDK

  3. 云资源编排工具:Terraform、Pulumi、CloudFormation

  4. 云服务自动化配置:VPC、安全组、负载均衡

  5. 云数据库自动化管理:RDS自动创建、备份、扩缩容

  6. 云存储自动化:对象存储生命周期、权限策略

  7. 云监控自动化:云监控指标采集、告警配置

  8. 云成本自动化优化:资源调度、闲置资源回收

  9. 云安全自动化:IAM策略、审计日志、合规扫描

  10. 多云统一运维:资源抽象、统一API

  11. 云平台自愈能力:故障检测、自动恢复

  12. 综合实战:通过Terraform管理阿里云资源并集成监控


专题十:自动化运维平台与工具链

  1. 自动化运维平台设计理念:统一入口、流程编排、自助服务

  2. CMDB与自动化联动:配置驱动、自动发现

  3. 作业平台设计:脚本库、任务编排、审批流

  4. 工单系统与自动化集成:自动执行、结果反馈

  5. 流程引擎(BPM)在运维中的应用

  6. 运维门户建设:服务目录、权限管理、计量计费

  7. 自动化工具链整合:API网关、统一认证

  8. 运维数据平台:数据采集、存储、分析、展示

  9. 自动化度量平台:效率指标、质量指标、成本指标

  10. 运维机器人:ChatOps、通知、交互式执行

  11. 开源自动化平台:Spug、OPSANY、WGCLOUD

  12. 综合实战:基于开源平台构建运维自动化门户


专题十一:自动化安全与合规

  1. 自动化带来的安全风险:权限失控、配置错误、密钥泄露

  2. 最小权限原则在自动化中的应用

  3. 密钥与凭证管理:Vault、KMS、Secrets Management

  4. 自动化脚本安全审计:代码扫描、敏感信息检测

  5. 自动化配置合规检查:Open Policy Agent、Gatekeeper

  6. 镜像与制品安全扫描:Trivy、Clair自动化集成

  7. 容器运行时安全自动化:Falco策略、告警响应

  8. 合规基线自动化扫描:CIS Benchmark、kube-bench

  9. 自动化应急响应:自动隔离、自动恢复

  10. 安全事件自动处置:SOAR(安全编排自动化与响应)

  11. 自动化合规报告生成

  12. 综合实战:配置Vault动态密钥并集成到CI/CD流水线


专题十二:自动化运维最佳实践与演进

  1. 自动化运维实施路线图:调研、试点、推广、优化

  2. 自动化项目成功关键因素:组织支持、文化培养、技能提升

  3. 自动化运维度量指标体系:自动化覆盖率、成功率、节省工时

  4. 自动化运维常见陷阱与规避:过度自动化、维护成本、单点故障

  5. 自动化运维文档与知识库建设

  6. 自动化运维团队协作模式:开发与运维融合

  7. 自动化运维与AI融合:AIOps、异常检测、根因分析

  8. 自动化运维演进趋势:无服务器、平台工程、数据驱动

  9. 自动化运维在信创环境下的实践

  10. 企业自动化运维成熟度评估模型

  11. 自动化运维案例复盘:某企业自动化转型之路

  12. 综合大作业:设计企业自动化运维三年演进规划





如果您想学习本课程,请预约报名
如果没找到合适的课程或有特殊培训需求,请订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表点击在线申请

服务特点:
海量专家资源,精准匹配相关行业,相关项目专家,针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示,快捷高效,省时省力省钱。

专家力量:
中国科学院软件研究所,计算研究所高级研究人员
oracle,微软,vmware,MSC,Ansys,candence,Altium,达索等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享
针对客户实际需求,案例教学,互动式沟通,学有所获
报名表下载
联系我们 更多>>

咨询电话010-62883247

                4007991916

咨询邮箱:soft@info-soft.cn  

 

  微信咨询

随时听讲课

聚焦技术实践

订制培训 更多>>