课程目标:
- Hadoop大观园,介绍Hadoop生态系统的各个组成模块与适用场景。
- Hadoop部署与编程,讲解演示在生产环境中选用和配置服务器需要注意的事项,介绍HDFS编程的Java API使用。
- Hadoop集群架构搭建
- MapReduce编程与调优:讲解演示MapReduce的中高级应用开发与调优技能。
- Hive编程与调优:讲解演示MapReduce的中高级应用开发与调优技能。
- HBase编程与调优:讲解演示HBase的中高级应用开发与调优技能。
- Hadoop系统管理:讲解Hadoop系统的高级配置与管理技能。
-
- 培训内容:
-
Hadoop大观园 |
- 文件存储-HDFS
- HDFS-工作原理
- 数据计算MapReduce
- MapReduce工作原理
- SQL分析-Hive
- 海量实时读写-HBase
- 工作流调度-Ooize
- 分布式协调系统—Zookeeper
|
Hadoop部署与编程
|
- Hadoop版本介绍与选择
- Hadoop部署实践
a) Hadoop安装文件构成与配置体系
b) 机器硬件建议配置
c) 系统环境配置
d) 基本参数配置与说明
e) 进程分布规划与启动
- Hadoop基本使用操作
a) HDFS
b) 权限
c) MapReduce
- HDFS编程
a) 开发环境准备
b) 读文件
c) 写文件
|
Hadoop集群架构搭建 |
- Hadoop集群架构搭建方法
- Hadoop集群架构性能管理
- HDFS,NameNode,DataNode的调优和节点扩展最佳实践
- 主要调优工具和性能监控工具
- Hadoop集群对于硬件的要求和选型
- Hadoop集群中对硬件、操作系统的调优方法
- 实际案例分析
- 基于Hadoop的集群解决方案
|
MapReduce编程与调优 |
- MR与YARN介绍
- 编程实战
- 基本MapReduce程序编写
- 基于MapReduce的高级操作(排序,分区,二次排序)
- 基于MapReduce的Join操作
- 调整MR框架运行参数,提升运行效率
- 选择合适的Map与Reduce数量
- 设置Map端参数
- 设置Reduce端参数
- 使用HPROF对MR任务进行Profiling
- 代码调试
- 运行日志
|
Hive编程与调优 |
- Hive系统部署与搭建
- Hive工作机制
- 基于Hive的网站日志分析示例
- Hive的用户自定义函数开发
- Hive底层数据文件与数据压缩选择
- Hive运行参数调优
- Hive程序编写性能建议
- MapJoin
- 数据倾斜
- Join顺序
- UDF编写注意事项
- 快速获取结果TopN
- 通过Explain观察Hive行为
|
HBase编程与调优 |
- HBase系统架构
- 基于HBase的网盘应用示例
- HBase性能测试
- HBase编程与调优
- HBase系统部署与搭建
- HBase系统架构与原理
- HBase编程基础
- HBase高级编程功能与实例
- HBase数据存储编码选择
- HBase性能测试与分析
|
Hadoop系统管理 |
- Hadoop系统性能监控系统(Ganglia)搭建
- Hadoop系统容灾策略
- Hadoop资源调度策略
- Hadoop高级配置参数
- Hadoop安全
- Hadoop系统监控与报警策略
- 总结、答疑
|
如果您想学习本课程,请
预约报名
如果没找到合适的课程或有特殊培训需求,请
订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表点击在线申请
服务特点:
海量专家资源,精准匹配相关行业,相关项目专家,针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示,快捷高效,省时省力省钱。
专家力量:
中国科学院软件研究所,计算研究所高级研究人员
oracle,微软,vmware,MSC,Ansys,candence,Altium,达索等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享
针对客户实际需求,案例教学,互动式沟通,学有所获