中国信息协会

   中国信息协会信息服务网络委员会文件
中信网培字[2013]019号
关于举办“大数据的处理技巧及案例分析”高级研修班的通知
各有关单位:
   大数据分析作为数据分析的前沿技术,广泛应用于物联网、云计算、移动互联网等新兴产业。为加强大数据分析,创新发展顶层设计和科学布局,推动相关人员更好理解和掌握大数据分析的关键技术原理和未来发展方向,使各企事业单位利益最大化,中国信息协会信息服务网络委员会决定举办“大数据的处理技巧及案例分析”高级研修班,并委托北京中建研信息管理咨询中心承办,望各单位收到通知后组织相关人员参加。现将有关事宜通知如下:
课程内容
课程模块 课程主题 主要内容 案例和演示
模块一 Hadoop的来源和动机 传统大规模系统存在的问题 
Hadoop概述 
Hadoop分布式文件系统      
MapReduce工作原理         
Hadoop集群剖析            
 Hadoop生态系统对一种新的解决方案的需求
Hadoop的行业应用案例分析
Hadoop在云计算和大数据的位置和关系 Hadoop在淘宝、支付宝的作用
电商眼中的Hadoop和推荐系统。
移动大云项目(big cloud)中的Hadoop
联通使用Hadoop/Hbase解决3G详单查询问题。
模块二 Hadoop生态系统介绍和演示 Hadoop HDFS 和 MapReduce 
Hadoop数据库之HBase 
Hadoop数据仓库之Hive
Hadoop数据处理脚本Pig 
Hadoop数据接口Sqoop和Flume,Scribe DataX 
Hadoop工作流引擎 Oozie Yahoo如何使用Hadoop构建大规模搜索的应用
FaceBook 基于Hadoop构建数据仓库
模块三 Hadoop组件详解 Hadoop HDFS 基本结构
Hadoop HDFS 副本存放策略
Hadoop NameNode 详解
Hadoop SecondaryNameNode 详解 
Hadoop DataNode 详解
Hadoop JobTracker 详解 
Hadoop TaskTracker 详解 Hadoop Mapper类核心代码
Hadoop Reduce类核心代码
Hadoop 核心代码
模块四 Hadoop安装和部署 Hadoop系统模块组件概述
Hadoop试验集群的部署结构
Hadoop 安装依赖关系
Hadoop 生产环境的部署结构
Hadoop集群部署
Hadoop 高可用配置方法
Hadoop 集群简单测试方法 
Hadoop 集群异常Debug方法 Hadoop安装部署实验
Red hat Linux基础环境搭建
Hadoop 单机系统版本安装配置
Hadoop 集群系统版本安装和启动配置 
使用 Hadoop MapReduce Streaming 快速测试系统
Hadoopcore-site,hdfs-site,mapred-site 配置详解
模块五 Hadoop和数据库技术优劣势对比 Hadoop/Hive 对比 Oracle 在构建数据仓库上的优劣势
Hadoop 如何和传统IT系统配合完成原来不可能的任务 Apache社区版本:Cloudera 版本、MapR版本、Intel版本、Oracle、Dell、HP版本
模块六 编写MapReduce高级程序 使用 Hadoop MapReduce Streaming 编程
MapReduce流程          
剖析一个MapReduce程序 
基本MapReduceAPI 概念  
驱动代码 Mapper、Reducer
Hadoop流 
API 使用Eclipse进行快速开发               
新MapReduce API 
MapReduce的优化
MapReduce的任务调度
MapReduce编程实战
如何利用其他Hadoop相关技术,包括Apache Hive, Apache Pig,Sqoop和Oozie等 
满足解决实际数据分析问题的高级Hadoop API Hadoop Streaming 和 Java MapReduce Api 差异。
 MapReduce 实现数据库功能
利用Combiners来减少中间数据
数据压缩解压算法
基于统计模型的压缩算法 :Huffman编码、算数编码、PPM算法
基于字典模型的编码:LZ77算法、LZ78算法、LZW算法
面向实时数据的专用压缩算法:矩形波串法、后向斜率法、旋转门压缩算法。
其他压缩算法:RLE文本压缩算法、BWT算法
编写Partitioner来优化负载平衡
 直接访问Hadoop分布式文件系统(HDFS)
Hadoop的join操作
辅助排序在Reducer方的合并
 定制Writables和WritableComparables 
使用SequenceFiles和Avro文件保存二进制数据 
创建InputFormats OutputFormats
Hadoop的二次排序
Hadoop的海量日志分析
在Map方的合并       
模块七 集成Hadoop到现有工作流 
及Hadoop API深入探讨 存储系统 
利用Sqoop从关系型数据库系统中导入数据到Hadoop 
利用Flume导入实时数据到Hadoop 
ToolRunner介绍、使用MRUnit进行测试 
使用Configure和Close方法来进行Map/Reduce设置和关闭 使用FuseDFS和Hadoop访问HDFS
使用分布式缓存(Distributed Cache)
直接访问Hadoop分布式文件系统(HDFS) 
利用Combiners来减少中间数据
编写Partitioner来优化负载平衡  
模块八 使用Hive和Pig开发及技巧 Hive和Pig基础              
Hive的作用和原理说明
Hadoop仓库和传统数据仓库的协作关系
Hadoop/Hive仓库数据数据流
Hive 部署和安装
Hive Cli 的基本用法
HQL基本语法
使用Oozie的动机      
 Oozie工作流定义格式   使用JDBC 连接Hive进行查询和分析
使用正则表达式加载数据
HQL高级语法
编写UDF函数
编写UDAF自定义函数
使用Sqoop进行数据分析
使用oozie配置工作流
phpHiveAdmin 安装和使用
模块九 实用开发技巧 排序和搜索索引            
用Mahout进行机器学习 
Term Frequency – Inverse Document Frequency 
图论简介   Word Co-Occurrenc
用Hadoop表示图
一个图算法的实现:单源最短路径
二、培训时间及地点
    2013年12月13日—12月16日 (13日全天报到)  深圳
   2014年 1月14日— 1月17日  (14日全天报到)  北京
  “机房建设与管理”的课程(所有内容QQ:931053300)
   2013年12月 3日—12月6日   (3日全天报到 )上海
   2014年1月 12日—1月15日   (12日全天报到 )海南*海口
  “信息安全与网络攻防”的课程(所有内容QQ:931053300)
   2013年12月6日—12月9日  (6日全天报到)  上海
   2014月1月9日-1月12日    (9日全天报到)  海南*海口
三、培训对象
   各地政府云计算、物联网产业相关负责人,各企业CIO、信息中心负责人、技术总监,云计算产业投资团队,云计算应用开发商,云计算硬件设备供应商,云服务提供商,高校、科研院所云计算项目负责人,设计师、架构师、系统管理员、开发经理、测试经理、产品经理、项目经理等。
四、培训特色:
   注重应用:分析国内实际情况,结合国际、国内成功经验。Hadoop采用实战的项目,让学员在短时间内掌握Hadoop基本运维思路和方法;对Hadoop集群进行管理和优化。并进行高效的大数据清洗和分析。
五、师资力量:
   届时将邀请国家信息化专家咨询委员会大数据专家、中国计算机学会大数据专家委员会的一线专家,拥有丰富的工程技术经验,从事大数据的大型项目,拥有资深的技术底蕴和专业背景,并结合实际互动答疑。   
 六、培训费用及颁发证书
    每人培训费3900元(含培训、教材、专家、场地、证书、学习用品费等),食宿统一安排,费用自理。
   参加相关培训并通过考试的学员,可以获得:《大数据分析工程师》证书。并且可通过国家信息技术人才服务网(www.ciso.net.cn)查询。
   该证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。
咨询与联系方式:
此表复印有效;请将回执表及银行汇款凭证传真至010-51137523
 电  话:010-51458793   51137523      传   真:010-51137523
 电子邮件:cx99@vip.sina.com             QQ号:931053300
 联系人:李栋梁(老师)
反对 0举报 0 收藏 0 评论 0
联系方式
  • 联系人李栋梁(先生)    
  • 会员 [加为商友] [发送信件]
  • 电话
  • 所在地北京市 西城区
  • 地址北京西城区
  • 主营行业信息化培训,大数据,云计算,物联网培训
  • 公司类型事业单位或社会团体
  • 注册年份1980
网站首页  |  联系方式  |  关于我们  |  问题解析  |  版权隐私  |  使用协议  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  粤ICP备1207862号

中国智能化网(zgznh®)--引领工业智能化产业发展 共享智能化+优质平台

版权所有:深圳市智控网络有限公司 学术指导:深圳市智能化学会

粤ICP备12078626号

深公网安备案证字第 4403101901094 号 | 粤公网安备 44030702001206号