讲师:冼茂源,国内屈指可数的Apache Hadoop源码级专家。 不容错过!
讲师每天战斗在hadoop工作一线,正负责某大型搜索引擎公司Hadoop/HBase计算平台研发工作,授课内容源于实战,注重实效,绝非纸上谈兵!
Hadoop Development Training
现场培训 + 在线直播培训同步进行
时间:8月31(周六) -9月1日(周日) , 共两天
现场培训:地点:上海. 浦东软件园 , 现场培训人数:20人,报满即止
或
网络在线培训:与现场同步进行,报名:http://www.chuanke.com/1109707-92088.html
课程目标
本课程适用于 Apache Hadoop 的开发人员,教授学员使用 Apache Hadoop 来构建强大的数据处理应用系统。
学习效益
通过本课程,学员将可以掌握:
- Hadoop的核心技术
- HDFS和MapReduce的工作原理
- 如何开发MapReduce应用
- 如何对MapReduce应用进行单元测试
- 如何使用MapReduce combiner、partitioner和distributed cache
- 如何实现MapReduce应用中的数据输入和输出
- 常见MapReduce任务的算法
- 如何对数据集使用join
适合对象
- 企业 IT 部门主管
- 云计算大数据平台主管
- 云计算系统架构师
- 云计算开发和运维人员
- 云计算项目经理
基础条件
- 本课程面向希望编写、维护或者优化Hadoop Job的开发人员。
- 参加培训的人员需要具备基本的编程经验;需要掌握Java知识;可以理解常用的计算机科学概念。之前是否使用过Hadoop并不是必须的条件。
课程大纲
1. Hadoop概述
- Hadoop的产生
- Hadoop基本概念
- Hadoop架构简介
- JobTracker/Tasktracker、NameNode/DataNode、scheduler
- 基本工具使用
2. MapReduce
- MapReduce编程入门
- MapReduce单元测试
3. Hadoop API深度使用
- Combiner与partitioner
- Streaming与多语言支持
- InputFormat基本类型及定制
- Configuration
- DataInputStream/DataOutputStream
- 多任务串接
4. 实战技巧及编程案例分析
5. Hadoop平台调试方法
6. HBase及Pig、Hive
了解更多相关情况:http://www.osforce.cn/?page_id=938
|