解决hadoop集群环境datanode无法启动的问题

来源:互联网 发布:怎么搜人名找域名 编辑:程序博客网 时间:2024/05/14 08:01
问题描述:
在集群模式下更改节点后,启动集群发现 datanode一直启动不起来。
我集群配置:有3个节点,其中第三台的datanode没有启动


其他均已经正常启动,利用 master:50070 , Live Nodes 为2, 随进入pc3:
ssh pc3.hadoop,  输入命令 jps ,发现只有 没有DataNode。随后看日志

上网查找解决方法,最后终于解决了,解决方法如下:
1. 先执行stop-all.sh暂停所有服务
2. 将所有Salve节点上的tmp(即 hdfs-site.xml 中指定的 dfs.data.dir 文件夹,DataNode存放数据块的位置)、 logs 文件夹删除 , 然后重新建立tmp , logs 文件夹
3. 将所有Salve节点上的/usr/hadoop/conf下的core-site.xml删除,将master节点的core-site.xml文件拷贝过来,到各个Salve节点
复制代码

4. 重新格式化: hadoop namenode -format(在更改slaves文件后,重新格式化一下namenode,基本上就不会有问题了)
5. 启动:start-all.sh

注:这是我碰到的情况,不见得是你遇到的问题,基本上从以下几个方面解决问题:
        1. 检查各个xml文件是否配置正确
        2. java环境变量配置是否正确
        3. ssh是否无密码互通
        4, Hadoop离开安全模式,hadoop dfsadmin -safemode leave。