课程培训
大数据财务分析培训

培训内容:

第一部分:如何构建分布式数据仓库平台
1. 怎么样才算是真正意义的大数据平台
2.      开源Hadoop介绍
3. 数据采集过程与分布式存储
 1)ETL介绍
 2)Sqoop
 3)HDFS
4. 数据仓库与数据分析
 1)MapReduce
 2)Hive
 3)Pig
 4)HBase
5. 集群监控与调度组件
 1)Ganglia监控
 2)Hadoop集群权限管理
 3)Hbase列数据库监控
 4)Oozie介绍
6.      Hue介绍
7.      运营商全国用户上网记录案例介绍
8.      网上舆情分析

第二部分:大数据平台部署及案例
1. 我们应该选哪种Hadoop?
 1)选哪个版本?为什么?
 2)选哪种发行版本?为什么?
2. 集群硬件应该如何选配?
 1)内存
 2)CPU
 3)硬盘
3. 部署案例讲解
 1)英特尔Hadoop详解
 2)某省级通信运营商清帐单查询系统介绍

第三部分:Hbase列数据库及应用案例
1. Hbase感性认识
 1)Hbase简介
 2)Hbase特点
 3)HBase与RDBMS对比
 4)HBase体系结构
 5)Hbase常见概念
 6)性能优化
2. Hbase主要组成
 7)Zookeeper、Hmaster
 8)HRegionServer、Region
 9)HStore存储、Hfile
 10)Hbase内部扫描RowKey的原理
 11)Hbase内部读写原理
 12)HBase设计原理、架构分析
 13)Hadoop+HBase伸缩性(自动扩容、热部署)
 14)HBase相关表结构设计(列族、列详细分析)
 15)HBase主HMaster与备用HMaster间的切换原理
 16)HBase基本命令介绍
3. 如何使用Hbase?
 17)Hbase的6种使用方式
 18)HBase Shell方式访问;
 19)HBase Java API方式访问;
 20)Hive+Hbase方式访问;
 21)Pig+Hbase方式访问;
4. Hbase+Zookeeper使用配置
 22)Zookeeper简介
 23)Zookeeper与 HBase 的关系
5.      Hbase的RowKey设计原则
6. 项目案例:
 24)HBase在小米业务的应用

第四部分:大数据挖掘介绍与应用案例
1. 大数据挖掘和传统数据挖掘区别?
 1)传统数据挖掘
 2)SPSS Modeler 14.2
 3)SAS简介
 4)Mahout简介
 5)R语言介绍
 6)R语言连接HIVE
2. 算法介绍和应用
 1)关联分析
 2)K-means
 3)决策数据C5.0
 4)逻辑线性Logistic回归
 5)主成分/因子分析
 6)Apriori算法
 7)预测算法
 8)神经网络
 9)协同过滤挖掘算法
3. 项目案例详解
 1)用户行为编好分析
 2)客户流失预测分析
 3)营销产品推荐系统
 4)TF-IDF与余弦相似性的应用
 




如果您想学习本课程,请预约报名
如果没找到合适的课程或有特殊培训需求,请订制培训
培训特点:
针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示
培训讲师:
中国科学院软件研究所,计算研究所高级研究人员
IBM,oracle,微软,vmware等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享。
针对客户实际需求,案例教学,互动式沟通,学有所获
报名表下载
联系我们 更多>>

咨询电话010-62883247

                010-62884854

咨询邮箱:soft@info-soft.cn  

 

微信号.jpg

  微信咨询

随时听讲课

聚焦技术实践

订制培训 更多>>