| 分布式系统介绍 |
- 分布式存储系统:HDFS
- 分布式计算系统:MapReduce
- 海量数据分析系统:Hive
- 分布式协调系统:Zookeeper
- 分布式实时读写数据存储系统:HBase
- 工作流调度系统:Ooize
|
| Hadoop系统部署实际操作
|
- 选择合适的Hadoop版本
- 分布式部署Hadoop
- 系统校验
|
| 分布式程序(MapReduce)开发实战 |
| MapReduce编程理论 |
- 什么是MapReduce
- MR程序开发准备
- MR程序的调试
|
| MapReudce编程实战
|
- CASE 1:基本MapReduce程序编写
- CASE 2:基于MapReduce的Sort操作
- CASE 3:基于MapReduce的Join操作
- CASE 3:Hadoop多语言编程框架Streaming
|
| 海里网站日志分析系统示例 |
|
| Hive系统的部署与使用 |
| Hive系统部署 |
- 搭建Hive客户端
- 搭建Hive元数据库(MySQL)
|
| Hive系统使用 |
- Hive工作原理
- Hive DDL
- Hive DML
- Hive Query
|
| 基于列蔟的NoSQL—Hbase&Cassandra |
| HBase系统理论 |
|
| HBase in action |
- 编程接口
- 整合MapReduce
- 表设计方案
- HBase系统管理
|