课程培训
大数据平台自动化运维培训课程
培训对象

各类 IT/软件企业和研发机构的大数据工程师以及运维工程师。对于怀有大数据平台管理和运维疑问和问题,需要梳理解答的团队和个人,效果最佳。


学员基础

学员学习本课程应具备下列基础知识: 1) 了解Java语言; 2) 了解Linux系统; 3)数据挖掘基础



课程大纲



 

主题

内容

 大数据运维系统基础
大数据架构概述

1. 大数据技术特点
剖析开源、社区模式、更新快等特点
2. 大数据六层架构
介绍大数据系统基本架构
3. HadoopSpark生态系统概述以及版本演化
概要介绍HadoopSpark生态系统及其版本演化历史

大数据自动化运维挑战

1. 大规模集群
2. 复杂的软件栈
3. 问题的复杂性(操作系统、网络、软件、应用程序及用户)

大数据运维体系

1. 大数据运维系统特点
2. 大数据运维系统构成
包括自动化部署、自动化配置管理、监控、报警、自动审批系统(存储空间审核、计算资源审核)等

大数据运维常用技术栈

1. Linux机器资源监控与报警
ganglianagios
2. 常用linux命令
topfreesariostatnmonjstacksshrsync
3. Java基础
JVM、内存管理、GC调优
4. 用户管理
LDAP系统
5. 自动化安装部署
6. ambaricloudera manager

Linux系统基本配置

1. 大数据系统对linux要求
2. 大数据系统常见linux配置

 数据收集与存储系统运维

分布式数据收集系统运维

1. flumesqoop基本架构与原理
介绍如何使用flumesqoop两个系统将外部流式数据(比如网站日志,用户行为数据等)、关系型数据库(比如MySQLOracle等)中的数据导入Hadoop中进行分析和挖掘
2. Flumesqoop运维

分布式存储系统运维

1. HDFS 原理、特性与基本架构
2 介绍HDFS原理与架构
3 HDFS运维
4用户管理
5存储空间管理(目录组织方式、份额设置等)
6 HDFS冷热数据分析与优化
7 NameNode管理
8 动态增加新的结点
9 尝试恢复丢失的数据块
关键参数设置(垃圾桶、GC等)
10 HBase原理与基本架构
11 介绍HBase应用场景、原理和架构
12 HDFS运维
13 表管理
14 常见参数调优

 资源管理系统运维
资源管理系统YARN基础

1 YARN产生背景及原理
2 YARN基本架构
3 YARN资源调度器
4 YARN为核心的生态

资源管理系统YARN运维

1. 参数配置与调优
2. 用户管理
3. 资源池划分
4. 资源监控

分布式协调服务Zookeeper

1. Zookeeper产生背景
2. Zookeeper基本架构
3. Zookeeper设计原理
4. Zookeeper安装部署及运维
5 参数配置与调优

 分布式计算框架运维

分布式计算框架概述

1. 批处理计算框架MapReduceSpark
2. 交互式分析框架PrestoImpala
3. 流式计算框架StormSpark Streaming

分布式计算框架(应用程序)运维

1. 批处理应用监控指标
2.交互式框架运维实践
3. 流式计算框架运维实战

总结 

大规模大数据集群的运维新挑战与应对方案

1.大规模集群新挑战
2.大规模集群自动化运维系统




如果您想学习本课程,请预约报名
如果没找到合适的课程或有特殊培训需求,请订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表点击在线申请

服务特点:
海量专家资源,精准匹配相关行业,相关项目专家,针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示,快捷高效,省时省力省钱。

专家力量:
中国科学院软件研究所,计算研究所高级研究人员
oracle,微软,vmware,MSC,Ansys,candence,Altium,达索等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享
针对客户实际需求,案例教学,互动式沟通,学有所获
报名表下载
联系我们 更多>>

咨询电话010-62883247

                4007991916

咨询邮箱:soft@info-soft.cn  

 

微信号.jpg

  微信咨询

随时听讲课

聚焦技术实践

订制培训 更多>>