搭建高可用的分布式hadoop2.5.2集群　 HDFS HA-白红宇

搭建高可用的分布式hadoop2.5.2集群　 HDFS HA

阅读量：5975 次

发布时间：2019-06-19

本文共 6255 字，大约阅读时间需要 20 分钟。

HA： High Available（高可用集群）

本次安装的hadoop2.5.2是64bit的，如果需要请在我之前的博文中

规划节点数：（仅考虑HDFS 的HA）

HDFS的节点分配：

两个NN 且分布在两台主机

三个DN节点

三个JN节点

两个ZKFC节点（必须和NN放在一台主机上）

三个Zookeeper

Mapreduce的节点：

一个ResourceManager（替代1.x时的JobTracker）

三个DATAManager（替代1.x时的TaskTracker）和DN节点数相同

主机名	NN	DN	ZK	ZKFC	JN	RM	DM
Node0	1		1	1		1
Node1	1	1	1	1	1		1
Node2		1	1		1		1
Node3		1			1		1

具体步骤：

一、# ln -sf /root/hadoop-2.5.2 /home/hadoop2.5.2

二、修改配置文件（hadoop2.5.2/etc/hadoop）

# vim hadoop-env.sh //修改JAVA_HOME

# vim slaves //配置DN的主机

node1 //DN1节点的主机

node2 //DN2节点的主机

node3 //DN3节点的主机

注意：因为hadoop2.x没有了SecondNode了，因此不要配master文件

# vim hdfs-site.xml

<name>dfs.nameservices</name>

<value>mycluster</value>

</property>

<name>dfs.ha.namenodes.mycluster</name>

</property>

<name>dfs.namenode.rpc-address.mycluster.nn1</name>

</property>

<name>dfs.namenode.rpc-address.mycluster.nn2</name>

</property>

<name>dfs.namenode.http-address.mycluster.nn1</name>

</property>

<name>dfs.namenode.http-address.mycluster.nn2</name>

</property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://node1:8485;node2:8485;node3:8485/mycluster</value>

</property>

<name>dfs.client.failover.proxy.provider.mycluster</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

</property>

<name>dfs.journalnode.edits.dir</name>

</property>

<name>dfs.ha.automatic-failover.enabled</name>

</property>

</configuration>

# vim core-site.xml

<name>fs.defaultFS</name>

<value>hdfs://mycluster</value>

</property>

<name>ha.zookeeper.quorum</name>

</property>

<name>hadoop.tmp.dir</name>

<value>/opt/hadoop2/</value>

</property>

</configuration>

安装zookeeper 【zookeeper-3.4.6】

#ln -sf /root/zookeeper-3.4.6 /home/zk

以下操作均在/home/zk下：

配置目录在，zk/conf/

#cp zoo_sample.cfg zoo.cfg //先将配置文件复制一份，重命名

# vim zoo.cfg

1.dataDir=/opt/zookeeper //修改默认值，默认放在/tmp ,

　2.文件最后添加以下几行

server.1=node0:2888:3888   //zookeeper所在节点的主机名server.2=mode1:2888:3888server.3=node2:2888:3888

修改完成后，创建/opt/zookeeper目录，并创建，编辑文件名为myid的文件

填充内容为server.1=node0:2888:3888 server后面的数字，不同节点对应不同数字，

如第二个zookeeper即node1上的节点对应的数字即为2

将/opt/zookeeper目录拷贝其他节点上

[root@node0 bin]# scp -r zookeeperroot@node1:/opt/

# scp -r zookeeper root@node2:/opt/

在将zookeeper整个软件工作目录拷到其他节点上去

[root@node0 ~]# scp -r zookeeper-3.4.6root@node1:~

# scp -r zookeeper-3.4.6 root@node2:~

别忘记做软连接

# ln -sf /root/zookeeper-3.4.6 /home/zk

配置Zookeeper的环境变量，写入/etc/profile,并将其他节点一并改写

# scp /etc/profile root@node1:/etc/profile

启动zookeeper

先关闭系统防火墙：# systemctl stop firewalld.service

或者# vim /etc/selinux/config //重启

每个节点都要启动：# zkServer.sh start

检测：

[root@node0 zookeeper-3.4.6]# jps

5403 Jps

5305 QuorumPeerMain

以上完成zookeeper的安装部署

下面要启动集群：

启动之前，将其他节点安装Hadoop2.5.2，并将之前的配置文件覆盖到每个节点，保持每个节点的配置文件相同

# scp ./*

# scp ./* root@node2:/home/hadoop2.5.2/etc/hadoop

# scp ./*

目录切换到/home/hadoop2.5.2/sbin

首先启动JN ：（在JN的节点上启动，即node1，node2，node3）

[root@node1 sbin]# ./hadoop-daemon.sh start journalnode

[root@node2 sbin]# ./hadoop-daemon.sh start journalnode

[root@node3 sbin]# ./hadoop-daemon.sh start journalnode

２.在任意一个NN的节点主机上（node0或者node1），格式化HDFS，目录切换到/home/hadoop2.5.2/bin

[root@node0 bin]# ./hdfs namenode –format

3．检查各个节点是JN是否正常，jps或者去当前格式化NN节点的主机下的/home/hadoop2.5.2/logs 查看JN日志

４．拷贝当前格式化NN节点的元数据文件（opt/hadoop2/dfs/name/current/*）

官方有推荐命令：

首先启动当前NN（格式化好的）：bin]#./hadoop-daemon.sh start namenode

检查：jps ，检查/opt/hadoop2/dfs/name/current有没有生成元数据文件

[root@node0current]# ll

总用量 16

-rw-r--r--.1 root root 351 6月 4 20:42fsp_w_picpath_0000000000000000000

-rw-r--r--.1 root root 62 6月 4 20:42 fsp_w_picpath_0000000000000000000.md5

-rw-r--r--.1 root root 2 6月 4 20:42 seen_txid

-rw-r--r--. 1 root root 205 6月 4 20:42 VERSION

５．官方文档推荐使用：在没有格式化的NN节点的主机上执行：bin]#./node –bootstrapStandby

这个命令就是将NN（已经格式化）生成元数据内容拷贝到NN（未格式化）的主机上在没有格式化的NN主机上检查有没有拷贝成功opt/hadoop2/dfs/name/current/*

然而，我自己编译的源码，没这玩意……

不过别担心，手动移动是一样有效的，[root@node0 opt]# scp -r hadoop2 root@node1:/opt

６．停止所有HDFS的节点的服务：zookeeper不要停 bin]#./stop-dfs.sh

７．在其中一个NN节点，格式化zkfs bin]# hdfs zkfc -formatZK

８．一次性启动所有dfs节点：sbin]#./start-dfs.sh

出现下图及说明安装无误：

用浏览器访问node0节点和node1节点，至于谁做active谁做standby完全取决于谁先拿到竞争锁

浏览器访问测试：（别忘更改自己的hosts文件，否则请用ip地址）

node0:50070 //NN1

node1:50070 // NN2

上床文件测试一下：

[root@node0 bin]# ./hdfs dfs -mkdir -p/usr/file //HDFS创建目录

[root@node0 bin]# ./hdfs dfs -put /root/zookeeper-3.4.6.tar.gz /usr/file //上传文件

这里说明：Hadoop1.x 默认block大小是64M Hadoop2.x默认block大小是128M

============================================================================

下面配置MapReduce

1. vim mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

</configuration>

2. vim yarn-size.xml

<name>yarn.resourcemanager.hostname</name>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

</configuration>

将这些配置文件一并拷贝到其他节点主机上

[root@node0 etc]# scp -r hadooproot@node1:/home/hadoop2.5.2/etc

[root@node0 etc]# scp -r hadooproot@node2:/home/hadoop2.5.2/etc

[root@node0 etc]# scp -r hadooproot@node3:/home/hadoop2.5.2/etc

重启 hadoop

[root@node0 sbin]# ./start-all.sh

浏览器访问 node0:8080

转载于:https://blog.51cto.com/icola/1786159

你可能感兴趣的文章

ubuntu 10.10下搭建android开发环境安装必要工作用软件

查看>>

Oracle内部错误:ORA-00600:[4097]一例

查看>>

flex4.6 图表在module中 x轴旋转正确的做法

查看>>

【C语言】20-static和extern关键字2-对变量的作用

驱动硬件Framebuffer驱动程序框架 skeletonfb.c 分析

查看>>

广播系统android安全：flag FLAG_RECEIVER_REGISTERED_ONLY的意义

查看>>

Spring Security 3.1 中功能强大的加密工具 PasswordEncoder

查看>>

【转】MFC下用ADO连接SQL SERVER，保存图片，BLOB

查看>>

Invert (mirror) a bitmap in-place

kaptcha 验证码在spring mvc 中的使用

查看>>

读取 XML 数据时，超出最大字符串内容长度配额 (8192)

node.js初探-超越昨天的自己系列（3）

查看>>