2.5 CDH版本Hadoop集群搭建

2.5.1 安装前期准备

本节中操作的是CDH5.10.0版本。下文安装步骤是曾经安装成功的,之后升级到CDH 5.10.0版本,安装步骤是一样的。

本节中安装的是CDH5.1.3版本,安装之前默认读者已经完成了Linux系统的设置。CDH对硬件的要求是每台服务器内存不低于10GB,所以安装CDH版本的主机不能是虚拟机。本节有任何安装问题可以参考作者博文:

• CDH安装和维护

http://blog.csdn.net/silentwolfyh/article/details/54893826

• CDH问题及维护汇总

http://blog.csdn.net/silentwolfyh/article/details/54893826

1.下载CDH的Hadoop版本软件

下载地址:

http://archive.cloudera.com/cdh5/parcels/5.10.0/

需要下载操作系统对应的版本,如图2-31所示。也可以从【百度云盘】中下载。

图2-31 CDH版本

• CDH-5.10.0-1.cdh5.10.0.p0.41-el7.parcel

• CDH-5.10.0-1.cdh5.10.0.p0.41-el7.parcel.sha1

• manifest.json

2.安装必备软件

    yum -y install psmisc
    yum -y install libxslt
    yum -y install screen
    yum -y install telnet

3.安装MySQL

登录Master机器,若可以联网,执行命令:

    yum install mysql-server

添加为自启动:

    chkconfig mysqld on

启动MySQL:

    service mysqld start
    mysqladmin -u root password '123456'

进入mySQL:

    mysql -uroot -p123456

执行下面四句SQL语句:

    create database hive DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
    create database ooz DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
    create database amon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
    create database hue default charset utf8 collate utf8_general_ci;

执行授权语句:

    grant all privileges on *.* to 'root'@'%' identified by '123456' with
    grant option;
@@@
    flush privileges;

2.5.2 Cloudera Manager安装

1.创建cloudera-scm用户

登录集群所有机器,执行命令,创建Cloudera SCM用户:

    useradd --system --home=/opt/cm-5.1.3/run/cloudera-scm-server/ --no-
    create-home --shell=/bin/false --comment "Cloudera SCM User"
    cloudera-scm

2.安装Cloudera Manager

登录Master机器,将cloudera-manager-el6-cm5.1.3_x86_64.tar.gz文件解压至/opt下,产生2个文件夹cloudera和cm-5.1.3。

3.添加MySQL Connector包

登录Master机器,将mysql-connector-java-5.1.34-bin.jar文件复制至目录/opt/cm-5.1.3/share/ cmf/lib/。

4.初始化CM5的数据库

登录Master机器,执行命令:

    /opt/cm-5.1.3/share/cmf/schema/scm_prepare_database.sh mysql cm -
    hlocalhost -uroot -p123456--scm-host localhost scm scm

5.修改Agent配置

登录Master机器,执行命令:

    vi /opt/cm-5.1.3/etc/cloudera-scm-agent/config.ini

将server_host的值改成Master机器的名称同步Agent到其他节点。

登录Master机器,执行命令:

    scp -r /opt/cm-5.1.3 root@slave[1-xx]:/opt/

6.准备Parcels

登录Master机器,将CDH-5.1.3-1.cdh5.1.3.p0.12-el6.parcel、CDH-5.1.3-1.cdh5.1.3.p0.12-el6.parcel.sha1和Manifest.json三个文件复制至/opt/cloudera/parcel-repo/文件夹下。

并将CDH-5.1.3-1.cdh5.1.3.p0.12-el6.parcel.parcel.sha1重命名为CDH-5.1.3-1.cdh5.1.3.p0.12-el6.parcel.parcel.sha。

7.启动Cloudera Manager

启动Cloudera Manager后等待1~3分钟,然后访问http://主节点IP:7180,若可以访问则表示安装成功。

登录Master机器,执行命令:

    /opt/cm-5.1.3/etc/init.d/cloudera-scm-server start

登录集群所有机器,执行命令:

    /opt/cm-5.1.3/etc/init.d/cloudera-scm-agent start

2.5.3 CDH安装

1.第一步登录

如图2-32所示为登录界面,用户名、密码皆设为admin。

图2-32

2.第二步选择部署版本

如图2-33、图2-34所示为选择部署版本。

图2-33 选择部署版本一

图2-34 选择部署版本二

3.第三步安装指定的主机

如图2-35所示,勾选上需要安装的主机。

图2-35 安装指定的主机

4.第四步集群版本选择

如图2-36所示,可以看到所下载并安装的CDH版本表示前面部署成功,否则需要在线下载。

图2-36 集群版本选择

5.第五步分发CDH指定版本

前面配置无误则无须下载,否则表示前面配置有误。分发可能需要一段时间,视集群大小而定(此时集群一定要保证Master可以免密码登录到其他机器上),如图2-37、图2-38所示。

图2-37 分发CDH指定版本一

图2-38 分发CDH指定版本二

6.第六步检查集群的状况

如图2-39所示,可根据提示信息修改配置并重新检查。

图2-39 检查集群的状况

7.第七步选择需要安装的组件

选择需要安装的组件,可自定义安装,如图2-40所示。

图2-40 选择需要安装的组件

8.第八步给集群各个节点分配角色

目前所知道需要注意的地方是HBase Thrift Server不要为空,否则Hue无法访问HBase。主要看Hive的角色,如图2-41所示。

图2-41 给集群各个节点分配角色

9.第九步设置MySQL连接

如图2-42所示。注意:这里很容易报错,都是表权限、名称、密码的错误。

图2-42 设置MySQL连接

10.第十步完成集群设置

后面的一路“继续”下去即可。安装所需时间较长,请耐心等待。设置过程如图2-43~图2-46所示。

图2-43 完成集群设置一

图2-44 完成集群设置二

图2-45 完成集群设置三

图2-46 完成集群设置四

11. CDH5.10.0主界面

CDH5.10.0主界面如图2-47所示。

图2-47 CDH5.10.0主界面