hadoop 数据节点故障
来源:互联网 发布:mac上安装什么虚拟机 编辑:程序博客网 时间:2024/05/17 09:30
namenode:50070/dfshealth.jsp显示一个节点dead,但是可以远程ssh过去,说明不是服务器宕掉了。jps没有显示tasktracker、QuorumPeerMain、HRegionServer等进程。通过df命令显示本地空间,发现data3(一共8块硬盘)顺序排在最前面,与平常有异,进入/data3提示“input/output error”.判断是硬盘问题,但是系统还是正常工作的,通过修改hdfs-site.xml里面dfs.data.dir (hdfs存放的路径)和mapred-site.xml 里面mapred.local.dir(tasktracker相关),去掉了和“data3”相关的目录。把相应的服务重启,数据节点就重新live了。至于data3的具体问题需要明天进机房查看。
进了机房之后,发现datanode确实有硬盘告警。进入raid之后,发现其中一块明显异常,将硬盘重新插拔后,红色告警消失。但是对raid并不是很懂,同去的同事想单独修复该硬盘的raid信息,但是在clear选项上直接点了yes.无奈重做raid和操作系统。将另一个数据节点的hadoop相关软件全部scp给新装的节点。数据节点已经重新进入了hadoop。期间ssh 和ganglia出了些问题,用百度的方法进行了修复。
ssh问题如下:
有一台服务器app ssh新装的服务器(一下简称dn17)时,虽然可以正常ssh,但是会弹出如下类似提示:
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
IT IS POSSIBLE THAT SOMEONE IS DOING SOMETHING NASTY!Someone could be eavesdropping on you right now (man-in-the-middle attack)!It is also possible that the RSA host key has just been changed.The fingerprint for the RSA key sent by the remote host is36:68:a6:e6:43:34:6b:82:d7:f4:df:1f:c2:e7:37:cc.Please contact your system administrator.Add correct host key in /u/xlian008/.ssh/known_hosts to get rid of this message.Offending key in /u/xlian008/.ssh/known_hosts:2RSA host key for 135.1.35.130 has changed and you have requested strict checking.Host key verification failed.
而其他所有节点访问新装节点都没有该警告,而该服务器访问其他节点也没有提示警告信息。网上找了下,发现在app的known_hosts里面dn17和别的服务器dn17记录不一样,估计保留的是以前的记录,复制修改后就好了
而ganglia信息不能监控到dn17,查看var/logs/,发现路由有问题,修改后也可以正常监控到所有节点物理信息了
- hadoop 数据节点故障
- hadoop和hbase节点故障重启
- Hadoop单节点故障改进方案对比
- hadoop节点故障解决一例
- hadoop节点一块硬盘故障更换方法
- hadoop datanode节点硬盘故障下线及上线方法
- Hadoop 数据节点DataNode异常
- Hadoop 添加数据节点(datanode)
- (4)Hadoop 添加和删除数据节点
- Hadoop源码分析笔记(九):数据节点--数据块存储
- Hadoop源码分析——数据节点数据发送
- Hadoop源码分析——数据节点写数据1
- Hadoop源码分析——数据节点写数据2
- hadoop故障解析
- hadoop SNN故障解决
- hadoop故障一例
- Hadoop故障分析
- hadoop故障及其应对
- 【百度地图API】如何制作商圈地图?行政地图?
- console控制台
- 免费分享全球知名安全软件AVG 使用一年
- 异常
- mysql 编码问题,
- hadoop 数据节点故障
- 网线的用法
- 比较完善的用HTML5做的坦克大战代码
- 责任链模式
- 09-使用for循环输出空心菱形(循环)
- Qt递归遍历文件夹和文件目录
- 黑马程序员-银行业务调度系统
- UML中几种类间关系:继承、实现、依赖、关联、聚合、组合的联系与区别
- T-SQL数据类型转换