HDFS超租约异常总结(org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException)
来源:互联网 发布:知乎top250 编辑:程序博客网 时间:2024/05/29 18:05
异常信息:
13/09/11 12:12:06 INFO hdfs.DFSClient: SMALL_BUFFER_SIZE is 512org.apache.hadoop.ipc.RemoteException: org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException: No lease on /tmp/put_dir/20130911-121205-858/ie_ping1_access_log.2013091111.lzo File does not exist. Holder DFSClient_-2082829022 does not have any open files. at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.checkLease(FSNamesystem.java:1623) at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.checkLease(FSNamesystem.java:1614) at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.completeFileInternal(FSNamesystem.java:1669) at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.completeFile(FSNamesystem.java:1657) at org.apache.hadoop.hdfs.server.namenode.NameNode.complete(NameNode.java:714)
字面理解为文件操作超租期,实际上就是data stream操作过程中文件被删掉了。之前也遇到过,通常是因为Mapred多个task操作同一个文件,一个task完成后删掉文件导致。
不过这次在hdfs上传文件时发生了这个异常,导致上传失败。google了一把,有人反馈跟dfs.datanode.max.xcievers参数到达上限有关。这个是datanode处理请求的任务
上限,默认为256,集群上面配置为2048.于是去所有datanode上面扫了一下log,发现果然出现了IOE:
java.io.IOException: xceiverCount 2049 exceeds the limit of concurrent xcievers 2048
翻源码找了一下xcievers,有DataXcievers和DataXcieversServer两个类,DataXcievers是DataXcieversServer启动的一个线程,用于处理输入输出数据流,其run()
方法有如下判断:
public void run() { ... int curXceiverCount = datanode.getXceiverCount(); if (curXceiverCount > dataXceiverServer.maxXceiverCount) { throw new IOException("xceiverCount " + curXceiverCount + " exceeds the limit of concurrent xcievers " + dataXceiverServer.maxXceiverCount); }
xcievers超过限制抛了一个IOException,这反应到DFSClient端,就是正在操作的文件失去了响应,于是就出现了上面的租约超期异常。
解决方案:
继续改大 xceiverCount 至8192并重启集群生效。
阅读全文
0 0
- HDFS超租约异常总结(org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException)
- HDFS超租约异常总结(org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException)
- HDFS超租约异常总结(org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException)
- org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException: org.apache.hadoop.hdfs.server.namenode
- org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException: No leas e on
- org.apache.hadoop.hdfs.server.namenode.NotReplicatedYetException
- org.apache.hadoop.hdfs.server.namenode.SafeModeException
- org.apache.hadoop.hdfs.server.namenode.SafeModeException
- org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot delete
- org.apache.hadoop.hdfs.server.namenode.safemode.exception
- org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot delete
- org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot delete
- Could not find the main class: org.apache.hadoop.hdfs.server.namenode.NameNode.解决方法
- 错误: 找不到或无法加载主类 org.apache.hadoop.hdfs.server.namenode.NameNode 问题解决
- 找不到或无法加载主类 org.apache.hadoop.hdfs.server.namenode.NameNode 问题解决
- hadoop分析之三org.apache.hadoop.hdfs.server.namenode各个类的功能与角色
- hadoop安全模式(rm: org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot delete /sort. Name )
- Hadoop 故障问题 org.apache.hadoop.hdfs.server.namenode.DecommissionManager: Interrupted Monitor
- loadrunner-app端支持6.5万并发license
- UltralISO制作Linux启动盘
- Linux基本命令
- 实用开发工具
- Idea 进行断点调试的 快捷键
- HDFS超租约异常总结(org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException)
- js动态添加HTML标签
- solr ①date类型处理+②自定义field 改为int型。报错处理
- 单链表中头指针与头结点的关系
- 人工智能与伦理
- 51Nod 1119 机器人走方格 V2 组合
- 基础练习 Sine之舞
- 反转二叉树
- LeetCode 215. Kth Largest Element in an Array (Medium)