运维技术培训课程体系(选修专题目录)
目录:
专题一:Linux系统基础与命令行入门
专题二:Linux系统管理与运维实战
专题三:Shell脚本编程与自动化运维
专题四:网络基础与服务配置
专题五:数据库运维(MySQL+Redis)
专题六:监控体系构建与日志管理
专题七:自动化运维与CI/CD实践
专题八:容器化与Kubernetes运维
专题九:云计算平台运维(OpenStack/阿里云)
专题十:高可用架构与性能优化
专题十一:安全运维与应急响应
专题十二:SRE实践与运维体系演进
专题一:Linux系统基础与命令行入门培训课程
课程名称:Linux系统基础与命令行入门培训课程
培训对象:
培训目标:
使学员从零开始掌握Linux操作系统的基本概念与核心命令,熟练使用Linux命令行进行日常文件操作、文本处理、权限管理;理解Linux系统目录结构与进程管理机制;具备独立安装Linux操作系统、配置基础网络环境的能力;为后续系统管理、运维开发等深入学习打下坚实基础。
培训内容介绍:
-
Linux概述与发展历史
Linux的起源与发展(Unix→GNU→Linux);Linux内核与发行版的关系;主流发行版对比(Red Hat/CentOS/Ubuntu/Debian);Linux应用领域:服务器/嵌入式/云计算/大数据;开源文化概述。
-
Linux系统安装与基本配置
虚拟机软件(VMware/VirtualBox)安装与使用;CentOS/Ubuntu系统安装全过程;系统启动流程与GRUB引导;网络配置(静态IP/DNS/主机名);SSH远程连接工具(Xshell/SecureCRT)使用。
-
Linux目录结构与文件基本操作
Linux文件系统层次标准(FHS);核心目录详解:/bin /etc /home /var /usr /tmp /proc等;绝对路径与相对路径;文件与目录操作命令:pwd/cd/ls/mkdir/touch/cp/mv/rm;文件查看命令:cat/more/less/head/tail。
-
Vim编辑器深度使用
Vim的三种模式:命令模式/插入模式/末行模式;光标移动技巧;文本编辑操作:复制/剪切/粘贴/撤销/恢复;文件保存与退出;Vim配置与插件管理;Vim实战:编辑配置文件。
-
文件属性与权限管理
Linux文件类型(普通文件/目录/链接/设备文件);文件权限表示法:rwx与八进制;权限管理命令:chmod/chown/chgrp;特殊权限:SUID/SGID/Sticky Bit;ACL访问控制列表;umask默认权限。
-
用户与组管理
用户账户文件:/etc/passwd /etc/shadow;用户管理命令:useradd/usermod/userdel;组管理命令:groupadd/groupmod/groupdel;密码管理:passwd;切换用户:su与sudo配置;用户身份切换场景。
-
文件查找与打包压缩
文件查找命令:find(按名/按型/按大小/按时间/按权限);find与exec结合;locate命令与updatedb;grep文本搜索;打包与压缩:tar/gzip/bzip2/zip;归档文件操作。
-
文本处理三剑客(grep/sed/awk)基础
grep正则表达式基础;sed流编辑器基本用法:替换/删除/打印;awk文本分析入门:列提取/条件过滤/简单统计;三剑客组合使用场景。
-
进程管理与系统监控
进程概念与生命周期;进程查看命令:ps/top/htop/pstree;进程控制:kill/killall/pkill;前台后台进程切换:jobs/fg/bg;系统负载分析与load average;内存使用查看:free/vmstat。
-
软件包管理
RPM包管理:rpm命令使用与依赖解决;YUM源配置与yum命令(CentOS);APT包管理(Ubuntu);源码编译安装:configure/make/make install;软件包查询与卸载。
-
磁盘与文件系统管理
磁盘分区概念;fdisk分区工具使用;文件系统创建:mkfs;分区挂载:mount/umount;开机自动挂载:/etc/fstab;磁盘空间查看:df/du;磁盘配额基础。
-
综合实战:Linux基础环境搭建与日常操作
完成从零到一的Linux基础环境搭建:系统安装→网络配置→用户管理→目录规划→文件操作→软件安装→进程管理→脚本练习,形成完整的Linux入门实践。
专题二:Linux系统管理与运维实战培训课程
课程名称:Linux系统管理与运维实战培训课程
培训对象:
培训目标:
使学员系统掌握Linux系统管理的核心技能,包括用户管理、磁盘管理、软件包管理、服务管理、日志管理、任务计划、系统监控等;深入理解系统启动流程与运行级别;熟练使用systemd管理服务;具备独立部署常见应用服务(FTP/NFS/Samba)的能力;能够进行日常系统巡检、故障排查与性能监控。
培训内容介绍:
-
系统启动流程与运行级别
Linux完整启动流程:BIOS→BootLoader→Kernel→init→Login;传统SysV init与运行级别;systemd架构与特性;systemd unit类型;目标(target)与运行级别对应关系;开机自启服务配置。
-
systemd服务管理
systemd核心命令:systemctl管理服务;service unit配置文件详解;自定义service unit;服务依赖与启动顺序;socket激活与定时器;systemd日志管理:journalctl使用。
-
磁盘管理进阶
磁盘分区扩展:parted工具与GPT分区;逻辑卷管理(LVM):PV/VG/LV创建与管理;LVM在线扩容与缩容;磁盘配额配置与监控;软RAID实现;磁盘性能测试(dd/hdparm)。
-
文件系统进阶
文件系统对比:ext4/XFS/Btrfs;XFS文件系统特性与管理;文件系统修复:fsck/xfs_repair;inode与block耗尽问题;磁盘挂载优化(noatime/nodiratime);swap分区与swap文件管理。
-
网络配置与管理
网络配置文件:/etc/sysconfig/network-scripts/(CentOS)与netplan(Ubuntu);网络接口管理:ifconfig/ip命令;路由表配置;主机名解析:/etc/hosts与DNS配置;网络连通性测试工具(ping/traceroute/telnet/curl/wget);网络抓包工具tcpdump基础。
-
日志管理系统
Linux日志体系:rsyslog服务;日志文件详解:/var/log/messages/secure/cron/dmesg等;rsyslog配置自定义;日志轮转logrotate配置;集中日志收集基础;ELK日志系统简介。
-
任务计划与自动化
一次性任务:at/batch;周期性任务:cron/crontab;cron任务格式详解;系统cron与用户cron;cron任务调试与排错;anacron非7×24小时运行系统。
-
系统备份与恢复
备份策略设计:全量/增量/差异;常用备份工具:tar/cpio/dd/dump/restore;远程备份:rsync原理与使用;rsync+inotify实时同步;镜像备份:clonezilla使用;灾难恢复演练。
-
系统监控与性能分析
系统监控命令:top/htop/vmstat/iostat/mpstat/netstat/sar;性能瓶颈分析方法;CPU/内存/磁盘/网络四大维度监控;监控工具集:nmon/glances/dstat;报警阈值设置;性能基准测试。
-
常见服务部署与管理
FTP服务:vsftpd安装配置(匿名/本地用户/虚拟用户);NFS网络文件系统:服务端与客户端配置;Samba服务:Linux与Windows文件共享;时间同步服务:NTP/Chrony配置。
-
Linux安全基础
账户安全策略:密码复杂度/过期时间;SSH安全配置:端口修改/root登录禁止/密钥认证;防火墙基础:iptables/firewalld入门;SELinux基础概念与模式切换;fail2ban防暴力破解。
-
综合实战:企业Linux服务器日常运维
模拟企业服务器环境,完成完整运维任务:系统初始化→用户创建→LVM分区→服务部署→任务计划→日志配置→监控配置→故障模拟演练。
专题三:Shell脚本编程与自动化运维培训课程
课程名称:Shell脚本编程与自动化运维培训课程
培训对象:
-
Linux运维工程师/系统管理员
-
需要编写自动化脚本的开发人员
-
DevOps实践者
-
希望提升工作效率的技术人员
培训目标:
使学员系统掌握Shell脚本编程的核心语法与编程思想,熟练使用变量、条件判断、循环、函数、数组等编程结构;深入理解正则表达式与文本处理三剑客(grep/sed/awk)的高级应用;能够编写自动化运维脚本完成系统巡检、备份、监控、批量部署等任务;具备脚本调试、优化与错误处理能力,实现Linux日常运维的全面自动化。
培训内容介绍:
-
Shell脚本基础与开发环境
Shell类型:bash/sh/zsh/csh;脚本第一行:#!/bin/bash;脚本创建、执行与调试;脚本执行方式对比:bash/sh/./source;脚本规范与注释;Shell脚本开发工具(Vim/VS Code +插件)。
-
变量与数据类型
变量定义与引用;环境变量 vs 本地变量;预定义变量与位置参数;只读变量与unset;变量作用域:export导出;特殊变量:$?/$/$0/$@/$#;变量的默认值处理(:- := :+ :?);readonly与declare。
-
运算符与表达式
算术运算符:+ - * / %;expr命令与$(() );let命令;数值比较与字符串比较;test命令与[ ];双括号[[ ]]高级特性;逻辑运算符:&& || !。
-
条件判断与分支控制
if/then/elif/else/fi结构;case多分支选择;条件测试:文件测试(-f/-d/-e/-r/-w/-x)、数值测试、字符串测试;空值判断;组合条件测试。
-
循环控制结构
for循环(列表形式/C语言形式);while循环;until循环;循环控制:break/continue;循环嵌套;循环中的输入重定向;select菜单生成。
-
函数定义与使用
函数定义语法;函数参数传递;函数返回值:return与echo;局部变量local;函数库设计;函数递归;脚本模块化设计。
-
数组与关联数组
普通数组定义与操作;数组遍历;数组切片与元素操作;关联数组(bash 4.0+)定义与使用;模拟二维数组;数组在批量操作中的应用。
-
文本处理三剑客进阶
grep高级:扩展正则表达式、多模式匹配、上下文控制、递归搜索;sed高级:地址定界、模式空间与保持空间、多行模式、脚本文件;awk高级:内建变量、自定义函数、数组应用、多文件处理、报表生成。
-
正则表达式深度解析
基本正则表达式(BRE)与扩展正则表达式(ERE);元字符详解:. * + ? ^ $ [] {} () |;POSIX字符类;前瞻后顾断言;正则表达式性能优化;常见正则表达式实例。
-
文件操作与文本处理
文件读取与遍历;while read line逐行处理;文件描述符与重定向(>/>>/</2>/&>/2>&1);管道与管道符;tee双向重定向;文件锁flock;临时文件创建。
-
系统管理与自动化任务
expect自动交互脚本;crontab任务调度;at一次性任务;系统监控信息采集(CPU/内存/磁盘/网络);进程检查与控制;服务状态管理;邮件通知配置。
-
错误处理与调试技巧
脚本退出状态;set -e/x/u调试选项;trap捕获信号与异常;调试技巧:echo打印/ bash -x /set -x;日志记录函数设计;常见错误类型与解决方案。
-
综合实战:自动化运维工具箱开发
开发一套完整的Shell自动化运维脚本集:系统信息采集、日志分析、备份脚本、批量部署、监控告警、服务自愈、定时任务管理、函数库封装。
专题四:网络基础与服务配置培训课程
课程名称:网络基础与服务配置培训课程
培训对象:
-
系统管理员/网络管理员
-
需要搭建网络服务的运维人员
-
准备向系统集成方向发展的技术人员
-
负责企业信息化建设的IT人员
培训目标:
使学员掌握计算机网络基础知识与TCP/IP协议原理,熟练配置Linux平台下的核心网络服务(DNS/DHCP/Web/FTP/NFS/Samba);理解服务的工作原理与安全配置要点;具备企业网络服务平台的搭建、维护与故障排查能力。
培训内容介绍:
-
计算机网络基础
网络定义与分类;OSI七层模型与TCP/IP四层模型;数据封装与解封装;IP地址与子网掩码;子网划分与CIDR;TCP与UDP协议特点;端口号概念。
-
Linux网络配置
网络配置文件;网络接口管理(ifconfig/ip);路由表配置;主机名与/etc/hosts;DNS客户端配置(/etc/resolv.conf);网络连通性测试工具;网络抓包基础(tcpdump)。
-
DNS域名服务
DNS解析原理;BIND安装与配置;主配置文件(named.conf);区域文件配置;资源记录类型;转发器与缓存DNS;主从DNS配置;DNS客户端测试(dig/nslookup)。
-
DHCP动态主机配置协议
DHCP工作原理;DHCP服务器安装与配置;作用域与地址池;保留地址与选项配置;DHCP中继;DHCP客户端配置;DHCP故障排查。
-
Web服务(Nginx/Apache)
HTTP协议基础;Nginx架构与安装;虚拟主机配置(基于域名/端口/IP);location匹配规则;反向代理配置;负载均衡算法;HTTPS配置;Apache基础配置。
-
FTP文件传输服务
FTP协议原理(主动/被动模式);vsftpd安装与配置;匿名访问与本地用户认证;虚拟用户配置;FTP权限控制;FTP SSL/TLS加密;客户端访问测试。
-
NFS网络文件系统
NFS工作原理;NFS服务器配置(exports);NFS客户端挂载;自动挂载(autofs);NFS安全选项;NFS性能优化。
-
Samba文件共享
SMB/CIFS协议;Samba安装与配置;共享目录配置;用户映射与认证;Windows客户端访问;Linux客户端访问(smbclient/mount);打印共享基础。
-
时间同步服务
NTP协议原理;Chrony服务配置;NTP客户端配置;时间同步验证;时区设置;硬件时钟与系统时钟。
-
SSH远程管理
SSH协议原理;SSH服务配置(sshd_config);密钥认证配置;SSH端口转发(本地/远程/动态);SCP/SFTP文件传输;SSH安全加固。
-
rsync数据同步
rsync工作原理;本地同步与远程同步;rsync over SSH;rsync守护进程模式;同步排除规则;增量备份实现;rsync+inotify实时同步。
-
综合实战:企业网络服务平台搭建
基于Linux系统搭建完整的企业网络服务平台:DNS域名解析→DHCP动态分配→Web网站服务→FTP文件传输→NFS/Samba文件共享→NTP时间同步→SSH远程管理→rsync数据备份。
专题五:数据库运维培训课程(MySQL+Redis)
课程名称:数据库运维培训课程(MySQL+Redis)
培训对象:
-
数据库管理员(DBA)
-
系统运维工程师
-
后端开发工程师(需掌握数据库运维)
-
需要管理企业数据存储的技术人员
培训目标:
使学员系统掌握MySQL关系型数据库与Redis非关系型数据库的安装、配置、管理、优化与高可用架构设计;深入理解MySQL主从复制、备份恢复、性能调优等核心运维技能;熟练使用Redis多种数据结构,掌握缓存策略、持久化、集群部署等高阶技术;具备独立应对企业级数据库运维挑战的能力。
培训内容介绍:
-
数据库基础与MySQL安装
数据库概念与分类;关系型数据库特点;MySQL版本选择与安装(源码/RPM/二进制);MySQL配置文件(my.cnf);启动与关闭;初始化与安全配置;MySQL客户端使用。
-
MySQL体系架构
MySQL逻辑架构;存储引擎对比(InnoDB vs MyISAM);InnoDB体系结构(缓冲池/重做日志/undo日志);MVCC多版本并发控制;事务ACID特性;锁机制(行锁/表锁/间隙锁)。
-
用户权限管理
用户账户创建与删除;权限授予与回收(GRANT/REVOKE);权限级别(全局/数据库/表/列);mysql.user表解析;密码策略与过期管理;SSL加密连接配置。
-
数据库备份与恢复
备份类型:物理备份 vs 逻辑备份;mysqldump使用与选项;全量备份与增量备份;二进制日志(binlog)解析与恢复;Xtrabackup物理备份工具;恢复演练与验证。
-
主从复制与高可用
主从复制原理(binlog + relay log);复制配置步骤;复制格式(Statement/Row/Mixed);GTID复制;半同步复制;主从延迟监控与优化;复制故障恢复;读写分离架构。
-
MySQL性能优化
慢查询日志配置与分析;EXPLAIN执行计划解读;索引设计原则与优化;SQL语句优化技巧;表结构优化(分区表/分表);MySQL参数调优(内存/连接/缓存);性能压测工具(sysbench)。
-
MySQL监控与运维
状态变量与性能指标;监控工具(Prometheus + mysqld_exporter);Zabbix监控MySQL;日常巡检脚本;连接数监控;死锁监控与处理;磁盘空间监控。
-
Redis基础与数据结构
Redis特点与应用场景;Redis安装与配置;五种基础数据结构(String/List/Hash/Set/Zset)使用;高级特性(Bitmap/HyperLogLog/Geo/Stream);常用命令;Redis客户端(redis-cli/图形化工具)。
-
Redis持久化
RDB快照原理与配置;AOF日志原理与重写;RDB+AOF混合持久化;持久化策略选择;数据恢复流程;持久化对性能影响。
-
Redis高可用集群
Redis主从复制;哨兵模式(Sentinel)架构与配置;Redis Cluster集群架构(数据分片/节点通信/故障转移);集群扩容与缩容;集群监控与管理。
-
缓存设计与优化
缓存更新策略(Cache Aside/Read Through/Write Behind);缓存穿透(布隆过滤器);缓存击穿(互斥锁/热点数据);缓存雪崩;分布式缓存与本地缓存;缓存淘汰策略。
-
综合实战:高并发数据库架构设计
以电商秒杀场景为例,设计高并发数据库架构:MySQL主从复制+读写分离;Redis缓存预热与库存扣减;缓存与数据库双写一致性;慢查询优化;主从延迟处理;监控体系部署;压测验证。
专题六:监控体系构建与日志管理培训课程
课程名称:监控体系构建与日志管理培训课程
培训对象:
-
系统运维工程师
-
监控运维工程师
-
需要构建企业监控体系的架构师
-
SRE(网站可靠性工程师)
培训目标:
使学员掌握企业级监控体系的完整构建方法,熟练使用Prometheus、Zabbix等主流监控工具;理解监控指标体系设计、告警规则配置、可视化展示等核心环节;深入掌握日志集中管理技术(ELK/EFK),实现日志采集、解析、存储与分析;具备构建统一监控告警平台、日志分析平台的全栈能力。
培训内容介绍:
-
监控体系概述
监控系统作用与价值;监控层次划分(基础设施/操作系统/中间件/应用/业务);监控指标类型(黄金指标/USE方法);监控系统选型对比(Zabbix/Prometheus/Nagios/Open-Falcon);可观测性概念(日志/指标/链路)。
-
Zabbix监控系统
Zabbix架构与组件(Server/Proxy/Agent/Web);Zabbix Server安装与配置;Agent部署与监控项配置;主机组与模板管理;触发器与告警配置;图形与聚合图形;Zabbix分布式监控。
-
Prometheus监控体系
Prometheus架构与特点;时序数据库概念;Prometheus Server安装;Exporters使用(node_exporter/mysqld_exporter);Pull模型与服务发现;PromQL查询语言;Grafana可视化集成。
-
监控指标设计
黄金监控指标(延迟/流量/错误/饱和度);系统级指标(CPU/内存/磁盘/网络);中间件指标(MySQL/Redis/Nginx);应用级指标(QPS/RT/错误率);业务级指标(订单量/用户数);指标命名规范。
-
告警管理
告警规则配置(Prometheus rules/Zabbix triggers);告警级别定义;告警通知渠道(邮件/钉钉/微信/电话);告警聚合与抑制;告警静默;告警风暴处理;告警自愈(Alertmanager webhook)。
-
Grafana可视化
Grafana安装与配置;数据源接入(Prometheus/Zabbix/MySQL);仪表盘设计原则;面板类型与配置;变量与模板;告警可视化;仪表盘分享与导出。
-
日志管理概述
日志管理挑战;日志集中管理价值;日志处理流程(采集→传输→解析→存储→分析→展示);ELK/EFK架构演进;日志采集规范。
-
Elasticsearch集群
Elasticsearch核心概念(索引/文档/分片/副本);ES集群架构;集群安装与配置;索引管理与映射;分词器与中文分词;性能优化与监控。
-
Logstash日志采集与处理
Logstash架构(Input/Filter/Output);日志采集配置(文件/Beats/Syslog);过滤器使用(grok/mutate/date/geoip);多行日志处理;性能调优。
-
Filebeat轻量级采集
Filebeat架构与优势;Filebeat配置;与Logstash/Elasticsearch集成;Module使用;Prospector与Registry;安全传输配置。
-
Kibana日志分析
Kibana安装与配置;数据探索与发现;索引模式配置;可视化组件(饼图/柱图/地图);仪表盘设计;日志搜索与过滤;Kibana告警(ELK Alert)。
-
统一监控告警平台实战
构建完整的企业监控与日志平台:Prometheus + Grafana实现指标监控;ELK实现日志集中管理;监控指标与日志关联分析;统一告警接入(Alertmanager);仪表盘设计(业务看板/系统看板/告警看板);监控体系文档化。
专题七:自动化运维与CI/CD实践培训课程
课程名称:自动化运维与CI/CD实践培训课程
培训对象:
-
运维开发工程师(DevOps)
-
系统运维工程师
-
需要提升自动化水平的开发人员
-
持续集成/持续交付实践者
培训目标:
使学员掌握自动化运维的核心工具与理念,熟练使用Ansible实现配置管理与应用部署;理解CI/CD持续集成/持续交付流程,掌握Jenkins/GitLab CI等工具的使用;能够搭建完整的自动化运维与CI/CD流水线,实现代码提交→自动构建→自动测试→自动部署的全流程自动化,提升交付效率与质量。
培训内容介绍:
-
自动化运维概述
自动化运维价值与目标;自动化演进路径(脚本化→工具化→平台化→智能化);自动化运维领域(配置管理/部署/监控/变更);DevOps理念与文化。
-
Ansible自动化工具
Ansible架构与特点(无代理/SSH/幂等性);Ansible安装与配置;Inventory主机清单(静态/动态);Ad-Hoc命令使用;常用模块(command/shell/copy/file/yum/service/user)。
-
Ansible Playbook
Playbook语法(YAML);Play与任务定义;变量定义与使用;条件判断(when);循环(loop);处理程序(handlers);标签(tags);模板(Jinja2)。
-
Ansible Roles与高级特性
Roles目录结构;角色创建与使用;Ansible Galaxy;角色依赖;变量优先级;Vault加密敏感数据;Playbook重用(include/import);错误处理。
-
Ansible企业应用
Ansible Tower/AWX简介;作业模板与调度;权限控制;Ansible与CMDB集成;Ansible批量部署实践;Ansible自动化巡检。
-
版本控制(Git)
Git工作原理;常用命令(init/clone/add/commit/push/pull/branch/merge);分支策略(Git Flow/GitHub Flow);Git Hook基础;Git与CI/CD集成。
-
持续集成基础
持续集成概念与价值;CI流程(代码提交→自动构建→自动测试→反馈);CI工具选型(Jenkins/GitLab CI/GitHub Actions)。
-
Jenkins CI/CD
Jenkins安装与配置;插件管理;构建任务创建(Freestyle/Pipeline);源码管理(Git);构建触发器;构建后操作;分布式构建(Master/Agent)。
-
Jenkins Pipeline
Pipeline概念;Declarative Pipeline vs Scripted Pipeline;Pipeline语法(stage/step/agent/environment);共享库;Pipeline可视化。
-
GitLab CI/CD
GitLab CI架构;.gitlab-ci.yml配置;Runner安装与注册;Job与Stage;缓存与制品;环境部署(environment);CI/CD变量。
-
制品管理与镜像仓库
制品概念;Nexus仓库搭建(Maven/NPM/Docker);Harbor私有镜像仓库;镜像安全扫描;制品版本管理。
-
持续部署实践
持续部署 vs 持续交付;部署策略(蓝绿部署/金丝雀发布/滚动更新);Ansible与Jenkins集成;Docker与Kubernetes部署;部署回滚机制。
-
综合实战:CI/CD完整流水线构建
搭建完整CI/CD流水线:Git代码提交触发→Jenkins/GitLab CI自动构建→单元测试→代码扫描→构建镜像推送Harbor→Ansible自动部署到测试环境→自动化测试→人工确认→部署到生产环境。
专题八:容器化与Kubernetes运维培训课程
课程名称:容器化与Kubernetes运维培训课程
培训对象:
-
系统运维工程师(向容器化转型)
-
后端开发工程师(需要掌握容器部署)
-
DevOps实践者
-
云原生技术爱好者
培训目标:
使学员系统掌握Docker容器化技术与Kubernetes容器编排平台的核心概念与实践;熟练编写Dockerfile进行应用容器化,使用Docker Compose进行多容器编排;深入理解Kubernetes核心资源(Pod/Deployment/Service/Ingress)与应用部署;掌握Kubernetes服务发现、配置管理、存储卷、弹性伸缩等生产级能力;具备独立将应用容器化并部署到Kubernetes集群的完整工程能力。
培训内容介绍:
-
容器技术概述
容器技术发展历程(Chroot→LXC→Docker);容器与虚拟机对比;容器核心概念(镜像/容器/仓库);Docker架构与工作原理;Docker安装与配置;OCI标准与兼容性。
-
Docker基础操作
镜像管理(pull/search/images/rmi/commit);容器生命周期(run/start/stop/restart/rm);容器交互(exec/attach/logs);数据管理(volume/bind mount);网络基础(端口映射/网络模式)。
-
Dockerfile镜像构建
Dockerfile指令详解(FROM/RUN/COPY/ADD/CMD/ENTRYPOINT/ENV/ARG/EXPOSE);镜像构建上下文;镜像分层与缓存优化;多阶段构建实践;最佳实践(减小体积/提升速度);镜像安全扫描。
-
Docker Compose
Docker Compose适用场景;docker-compose.yml编写;服务定义与依赖;网络与卷配置;环境变量管理;常用命令(up/down/logs/ps/exec);Compose项目实战。
-
容器编排与Kubernetes
容器编排需求;Kubernetes起源与演进;Kubernetes架构(Master/Node);核心组件(API Server/Scheduler/Controller Manager/kubelet/kube-proxy/etcd);Kubernetes安装方式(kubeadm/二进制/云厂商)。
-
Pod与容器
Pod设计理念;Pod配置(资源限制/重启策略/健康检查);Pod生命周期;init容器;静态Pod;多容器Pod设计模式(Sidecar/Ambassador/Adapter)。
-
工作负载资源
Deployment无状态应用部署(滚动更新/回滚/副本管理);ReplicaSet;StatefulSet有状态应用部署(稳定标识/有序部署);DaemonSet守护进程集;Job/CronJob批处理任务。
-
服务发现与负载均衡
Service类型(ClusterIP/NodePort/LoadBalancer/ExternalName);Service与Pod关联(标签选择器);kube-proxy代理模式;Ingress七层路由与TLS;Ingress Controller部署。
-
配置与密钥管理
ConfigMap创建与使用(环境变量/卷挂载);Secret类型与使用;ServiceAccount;RBAC权限控制;Downward API。
-
存储与持久化
Volume类型;PV/PVC概念与生命周期;StorageClass动态供给;有状态应用持久化存储;CSI接口;常用存储集成(NFS/Ceph)。
-
Kubernetes网络
CNI网络模型;网络插件选型(Flannel/Calico/Weave);NetworkPolicy网络策略;服务网格(Istio)简介。
-
Kubernetes监控与日志
Metrics Server;Prometheus + Grafana监控K8s;HPA弹性伸缩;日志采集方案(EFK/ELK);容器日志管理。
-
Helm包管理
Helm架构;Chart结构;模板编写;Release管理;仓库搭建;Helm部署应用。
-
综合实战:微服务容器化与K8s部署
以微服务应用为例,完成:Dockerfile编写→镜像构建推送→Kubernetes资源定义(Deployment/Service/Ingress/ConfigMap/PVC)→部署到K8s集群→配置HPA弹性伸缩→Prometheus监控→EFK日志收集。
专题九:云计算平台运维培训课程(OpenStack/阿里云)
课程名称:云计算平台运维培训课程(OpenStack/阿里云)
培训对象:
-
云计算运维工程师
-
数据中心管理员
-
需要管理云平台的技术人员
-
企业上云项目参与者
培训目标:
使学员掌握云计算基础概念与服务模型(IaaS/PaaS/SaaS),深入理解主流云平台架构;熟练使用OpenStack私有云平台进行虚拟机管理、网络配置、存储管理;掌握阿里云/腾讯云等公有云的核心产品使用(ECS/VPC/RDS/SLB/OSS);具备云平台日常运维、资源管理、成本优化、安全配置的综合能力。
培训内容介绍:
-
云计算概述
云计算定义与特征(按需自服务/广泛接入/资源池化/快速弹性/可计量);云计算服务模型(IaaS/PaaS/SaaS);部署模型(公有云/私有云/混合云/社区云);云计算关键技术(虚拟化/分布式存储/SDN)。
-
OpenStack架构
OpenStack项目起源与社区;OpenStack核心组件(Nova/Neutron/Cinder/Glance/Keystone/Horizon);组件间通信;OpenStack版本演进;部署方式简介(Kolla-ansible/Packstack)。
-
Keystone身份服务
Keystone架构与概念(User/Project/Role/Service/Endpoint);认证与令牌;权限管理;服务目录;配额管理。
-
Glance镜像服务
Glance架构;镜像格式与容器;镜像上传下载;镜像生命周期管理;镜像转换;镜像存储后端(本地/文件/Swift/Cinder)。
-
Nova计算服务
Nova架构(nova-api/nova-scheduler/nova-compute/nova-conductor);虚拟机规格(flavor);虚拟机生命周期(创建/启动/停止/删除/迁移);虚拟机迁移(冷迁移/热迁移);虚拟机高可用。
-
Neutron网络服务
Neutron架构(neutron-server/ML2插件/L3-agent/DHCP-agent);网络类型(provider网络/self-service网络);子网与路由器;安全组;浮动IP;LBaaS负载均衡服务。
-
Cinder块存储服务
Cinder架构;卷类型;卷生命周期(创建/挂载/卸载/删除/快照/备份);卷迁移;与后端存储集成(LVM/NFS/Ceph)。
-
Horizon仪表板
Horizon架构;仪表板配置;项目管理;用户自助服务;资源监控。
-
阿里云/腾讯云基础
云厂商选型对比;账号与权限管理(RAM);地域与可用区;专有网络VPC配置(子网/路由表/NAT网关);安全组与ACL;弹性公网IP。
-
云服务器ECS
ECS实例类型与规格;镜像选择;系统盘与数据盘;实例生命周期管理;实例监控与报警;SSH密钥对;自定义镜像创建;弹性伸缩(ESS)。
-
云数据库RDS
RDS产品系列;数据库引擎选择;实例创建与配置;读写分离;备份与恢复;监控与性能优化;数据库连接管理。
-
对象存储OSS
OSS概念(Bucket/Object/Endpoint);存储类型(标准/低频/归档);权限控制(Bucket Policy/RAM);生命周期管理;静态网站托管;CDN加速。
-
负载均衡SLB
SLB类型(公网/私网);监听配置(TCP/HTTP/HTTPS);调度算法;会话保持;健康检查;后端服务器管理。
-
综合实战:混合云平台运维
结合OpenStack私有云与阿里云公有云,实现混合云运维:私有云VMware/OpenStack虚拟机管理→公有云ECS创建与配置→VPC网络互通→RDS数据库部署→OSS对象存储使用→SLB负载均衡配置→云监控与告警设置→成本分析。
专题十:高可用架构与性能优化培训课程
课程名称:高可用架构与性能优化培训课程
培训对象:
-
高级系统运维工程师
-
系统架构师/技术负责人
-
需要处理高并发场景的运维人员
-
SRE(网站可靠性工程师)
培训目标:
使学员深入理解高可用架构设计的核心原则与模式,掌握负载均衡、集群、冗余、容灾等高可用技术;熟练使用Keepalived、LVS、HAProxy等工具构建高可用服务;具备系统性能分析、瓶颈定位与优化的能力;能够针对业务场景设计合理的高可用架构与性能优化方案。
培训内容介绍:
-
高可用架构概述
高可用定义与度量(SLA/可用性百分比);单点故障识别;高可用设计原则(冗余/故障转移/无状态);高可用架构模式(主备/双活/多活);CAP理论与BASE原则。
-
负载均衡技术
四层负载均衡 vs 七层负载均衡;负载均衡算法(轮询/最少连接/源地址哈希);DNS负载均衡;硬件负载均衡(F5)vs 软件负载均衡(LVS/HAProxy/Nginx);会话保持机制。
-
LVS负载均衡
LVS架构与工作原理;三种工作模式(NAT/DR/TUN);调度算法;Keepalived+LVS高可用配置;LVS性能优化;LVS监控与维护。
-
HAProxy高可用代理
HAProxy架构与特性;配置详解(global/defaults/frontend/backend);ACL规则;健康检查;统计页面;HAProxy性能调优。
-
Nginx高可用与负载均衡
Nginx负载均衡配置;Nginx upstream模块;健康检查;故障转移;Nginx限流配置;Nginx+Keepalived高可用。
-
数据库高可用
MySQL主从复制高可用(MHA/Orchestrator);MySQL Group Replication;MySQL Cluster;ProxySQL中间件;Redis哨兵与集群;数据库读写分离架构。
-
Keepalived高可用
VRRP协议原理;Keepalived安装与配置;虚拟IP漂移;健康检查脚本;抢占模式与非抢占模式;双主模式配置。
-
应用层高可用
应用无状态设计;会话共享(Redis/Memcached);分布式缓存;服务降级与熔断;限流设计;重试与幂等;异步解耦。
-
容灾与备份
容灾等级(热备/温备/冷备);同城容灾 vs 异地容灾;备份策略设计;数据一致性校验;容灾演练;备份恢复验证。
-
性能优化方法论
性能优化流程(监控→分析→优化→验证);性能指标解读;性能瓶颈分析(CPU/内存/磁盘/网络);USE方法应用;火焰图分析。
-
系统性能调优
Linux内核参数调优(网络/内存/文件系统);文件系统与I/O优化;进程调度优化;NUMA架构优化;JVM性能调优基础。
-
应用性能优化
数据库索引优化;SQL语句优化;缓存策略优化;连接池配置;异步处理;代码级优化;压力测试与基准测试。
-
综合实战:高可用电商系统架构设计
设计一个高可用电商系统架构:LVS+Keepalived四层负载均衡→HAProxy七层代理→Nginx集群→应用服务集群→MySQL主从+Redis缓存→Session共享→监控与告警→故障演练与切换。
专题十一:安全运维与应急响应培训课程
课程名称:安全运维与应急响应培训课程
培训对象:
-
安全运维工程师
-
系统管理员(需兼顾安全)
-
信息安全岗位技术人员
-
负责企业安全防护的IT人员
培训目标:
使学员掌握安全运维的核心知识与实践技能,深入理解主机安全、网络安全、应用安全等防护技术;熟练配置系统安全基线、防火墙策略、入侵检测系统;具备安全事件监控、分析、应急响应的实战能力;能够建立企业安全运维体系,有效防御常见网络攻击。
培训内容介绍:
-
安全运维概述
安全运维定义与目标;安全运维体系框架;常见安全威胁与攻击类型;安全事件分类与分级;安全运维组织架构;法律法规与合规要求。
-
系统安全加固
最小化安装原则;系统补丁管理;账户安全策略(密码策略/锁定策略);SSH安全配置(密钥/端口/协议限制);SELinux/AppArmor配置;文件权限审计;SUID/SGID管理。
-
网络安全防护
iptables/firewalld防火墙配置;网络隔离策略;端口扫描防护;DDoS攻击缓解;TCP Wrappers;网络流量监控;入侵检测系统(Snort/Suricata)部署。
-
应用安全防护
Web应用防火墙(ModSecurity/WAF);HTTPS证书部署;SQL注入防护;XSS攻击防护;文件上传安全;API安全认证;容器安全配置。
-
主机入侵检测
文件完整性监控(AIDE/Tripwire);系统日志审计;Rootkit检测(rkhunter/chkrootkit);异常进程检测;隐藏文件检测;系统后门排查。
-
日志审计与分析
日志集中管理架构;重要日志监控(secure/messages/auth);日志分析工具(logwatch/ossim);异常行为识别;合规性审计;日志留存策略。
-
漏洞管理
漏洞扫描工具(Nessus/OpenVAS);漏洞评估与优先级;漏洞修复流程;补丁管理;漏洞复测;虚拟补丁。
-
应急响应流程
应急响应阶段(准备/检测/抑制/根除/恢复/总结);应急响应团队组建;应急响应工具包;应急响应预案制定;应急响应演练。
-
常见攻击应急处理
DDoS攻击应急;Web入侵应急;勒索病毒应急;挖矿病毒排查;后门清除;数据泄露应急;钓鱼邮件应对。
-
安全取证基础
证据保全原则;内存取证;磁盘取证;日志取证;网络流量取证;时间线分析;取证报告撰写。
-
安全监控与告警
安全监控指标设计;SIEM平台部署(ELK/OSSIM/Splunk);安全告警规则配置;告警聚合与降噪;安全态势感知。
-
综合实战:安全事件应急响应演练
模拟安全事件场景(如Web被篡改/挖矿病毒/DDoS攻击),完成完整应急响应流程:事件发现→初步分析→抑制扩散→根除威胁→系统恢复→溯源分析→总结报告。
专题十二:SRE实践与运维体系演进培训课程
课程名称:SRE实践与运维体系演进培训课程
培训对象:
-
高级运维工程师
-
SRE(网站可靠性工程师)
-
运维架构师/技术负责人
-
需要构建现代运维体系的管理者
培训目标:
使学员深入理解SRE(网站可靠性工程)核心理念与实践方法,掌握服务等级目标(SLO)定义、错误预算管理、消除琐事等关键实践;熟悉容量规划、混沌工程、运维自动化等现代运维技术;具备构建和演进企业运维体系的能力,推动运维从传统运维向SRE/DevOps模式转型。
培训内容介绍:
-
SRE起源与核心理念
Google SRE起源;SRE与传统运维区别;SRE核心原则(拥抱风险/消除琐事/运维是软件工程问题/监控应面向服务/容量规划/自动化);SRE团队职责与角色。
-
服务等级目标(SLO)
SLI/SLO/SLA定义与关系;SLI指标选择(延迟/可用性/吞吐量/错误率);SLO目标设定;错误预算计算;错误预算策略;SLO监控与报告。
-
错误预算与风险容忍度
错误预算概念;错误预算与发布节奏;错误预算消耗与警报;风险容忍度设定;SLO违反处理;可用性改进计划。
-
消除琐事与运维自动化
琐事定义与识别;琐事量化与追踪;消除琐事策略(自动化/流程优化/平台化);运维自动化成熟度模型;自动化收益评估。
-
监控体系演进
传统监控 vs 现代监控;监控四个黄金指标;USE方法和RED方法;白盒监控与黑盒监控;监控即代码;告警最佳实践(避免告警疲劳)。
-
容量规划
容量规划目标;需求预测方法(趋势分析/季节性/业务驱动);容量压力测试;容量水位管理;弹性伸缩策略;成本优化。
-
发布与变更管理
变更风险控制;渐进式发布(蓝绿部署/金丝雀发布/灰度发布);发布回滚策略;变更自动化;变更评审与审计;变更成功率度量。
-
应急响应演进
MTTR指标;应急响应流程标准化;故障指挥体系(Incident Commander);故障复盘方法论;事后总结(无指责文化);知识库建设。
-
混沌工程
混沌工程起源与原则;混沌工程 vs 故障测试;混沌工程成熟度模型;混沌实验设计(稳态假设/实验范围/爆破半径);混沌工具(Chaos Monkey/Litmus);混沌工程实践。
-
运维平台化建设
运维平台演进路径(脚本→工具→平台→门户);CMDB建设;作业平台;发布平台;监控平台;配置中心;运维门户设计。
-
运维数据驱动决策
运维数据价值;数据采集与整合;运维数据指标体系;数据可视化;数据分析驱动决策;运维成本分析。
-
运维文化转型
DevOps/SRE文化特征;破除孤岛;协作与共享;拥抱失败;持续改进;运维成熟度模型;运维团队建设。
-
综合实战:SRE转型方案设计
针对现有运维团队与体系,设计向SRE转型的方案:现状评估→SLO定义→错误预算引入→自动化优先级→混沌工程试点→应急流程优化→运维平台规划→文化建设路径。
课程体系说明:
本课程体系覆盖从Linux基础入门到SRE高级实践的完整运维技术栈,兼顾理论基础与实践操作。学员可根据自身技术水平、工作方向和职业发展目标灵活选修。
学习路径建议:
-
初级运维路径:专题一 → 专题二 → 专题三 → 专题四
-
中级运维路径:专题五 → 专题六 → 专题七 → 专题八
-
高级运维路径:专题九 → 专题十 → 专题十一 → 专题十二
-
专项提升路径:自动化方向(专题三+专题七)→ 容器方向(专题八)→ 云平台方向(专题九)→ 安全方向(专题十一)
如果您想学习本课程,请
预约报名
如果没找到合适的课程或有特殊培训需求,请
订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表点击在线申请
服务特点:
海量专家资源,精准匹配相关行业,相关项目专家,针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示,快捷高效,省时省力省钱。
专家力量:
中国科学院软件研究所,计算研究所高级研究人员
oracle,微软,vmware,MSC,Ansys,candence,Altium,达索等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享
针对客户实际需求,案例教学,互动式沟通,学有所获