您所在的位置:首页>厂商培训
取得证书: CLoudera CCA证书
CCA培训周期:24学时
授课形式: 讲授、分组活动与练习等相互结合
Hadoop CCA课程背景:
Hadoop已成为业界大数据标准平台,通过培训学员会收获以下知识:
Hadoop分布式文件系统(HDFS)和MapReduce的工作原理
·如何优化Hadoop机群所需要的硬件配置
·搭建Hadoop机群所需要考虑的网络因素
·如何利用Hadoop配置选项进行系统性能调优
·如何利用FairScheduler为多用户提供服务级别保障
·Hadoop机群维护和监控
·如何使用Flume从动态生成的文件加载数据到Hadoop
·如何使用Sqoop从关系型数据库加载数据
·使用其他Hadoop相关系统工具(如Hive,Pig和HBase)所涉及到的系统管理问题
Hadoop CCA 课程大纲
1.关于 Apache Hadoop
> 为什么是Hadoop?
> Hadoop 的核心部件
> 基础概念
2.HDFS
> HDFS 特性
> 读,写文件
> NameNode内存的考虑
> HDFS 安全性简介
> 使用 Namenode Web 用户界面
> 使用Hadoop 文件 Shell
3.YARN 和MapReduce
> 什么是 MapReduce?
> MapReduce基本概念
> YARN 集群的架构
> 资源分配
> 故障恢复
> 使用 YARN Web 用户界面
> MapReduce 版本 1
4.为你的Hadoop 集群做计划
> 通用计划的考虑
> 选择正确的硬件
> 对网络的考虑
> 配置节点
> 为集群管理做计划
5.Hadoop 安装和初始配置
> 部署的类型
> 安装Hadoop
> 具体化Hadoop的配置
> 执行 HDFS 的初始配置
> 执行YARN 和 MapReduce 的初始配置
> Hadoop 日志系统
6.安装配置Hive, Impala和 Pig
> Hive
> Impala
> Pig
7.Hadoop 客户端
> 什么是Hadoop 客户端?
> 安装配置Hadoop 客户端
> 安装配置 Hue
> Hue 授权和认证 集群的
8.Cloudera 管理器
> Cloudera 管理器的动机
> Cloudera 管理器的特性
> 快速版和企业版
> Cloudera 管理器拓扑
> 安装Cloudera 管理器
> 用Cloudera 管理器安装hadoop
> 用Cloudera 管理器执行基本的管理任务
9.集群的高级配置
> 高级配置参数
> 配置Hadoop 端口
> 显性地添加或移除主机
> 配置HDFS 的机架认知
> 配置HDFS 高可用性
10.Hadoop的安全方案
>Hadoop的安全性的重要
>Hadoop的安全系统的概念
>Kerberos是什么,它如何工作
>用Kerberos来守卫Hadoop集群
11.管理, 计划工作任务
> 管理正在运行的工作
> 计划Hadoop 工作
> 配置 FairScheduler
> Impala 的查询计划
12.集群的维护
> 检查HDFS 状态
> 在不同集群间拷贝数据
> 添加和挪去集群的节点
> 重新平衡
13.集群的监控和故障诊断
> 通用系统监控
> 监控Hadoop 集群
> 常见的Hadoop Clusters
金源在线客服
QQ在线咨询
咨询电话
010-83650488
在线咨询