数据导入hive出现的问题记录
来源:互联网 发布:mac sftp 客户端 编辑:程序博客网 时间:2024/05/21 17:49
问题一:
【解决】Hive动态增加partitions不能超过100的问题,全量动态生成partitions超过100会出现如下异常:
解决100限制,可设置如下参数:
设置动态partitions为100000,该语句插入几年按天的partitions超过1000个,成功执行语句。
问题二:
过多的动态分区会导致job出现以下情况:
org.apache.hadoop.hive.ql.metadata.HiveException: org.apache.hadoop.ipc.RemoteException: org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException: No lease on /tmp/hive-maintain/hive_2012-11-28_22-39-43_810_1689858262130334284/_task_tmp.-ext-10002/part=33436268/_tmp.000004_0 File does not exist. Holder DFSClient_attempt_201211250925_9859_m_000004_0 does not have any open files.
解决方案:
加大动态分区数即可,下面是在当前session下设置。
SET hive.exec.max.dynamic.partitions=100000;
SET hive.exec.max.dynamic.partitions.pernode=100000;
从hbase或者hdfs导入hive时,数据量太大,会造成exeutors的内存不足,需采用 distribute by 参数
- insert overwrite table ods.cms_entity PARTITION (DAY)
- select
- ENTITY_ID ,
- ENTITY_NAME ,
- ENTITY_DESC ,
- ENTITY_TYPE ,
- ENTITY_PID ,
- ENTITY_TIME ,
- ENTITY_PRIORITY ,
- ENTITY_STATUS ,
- ENTITY_CHANNEL ,
- ENTITY_EDITOR ,
- ENTITY_TEMPLATE ,
- ENTITY_URL ,
- ENTITY_CATEGORY ,
- ENTITY_PARAM ,
- ENTITY_SHORTNAME ,
- ENTITY_SUBTYPE ,
- ENTITY_COMPDELAY ,
- day
- from stage.cms_entity_by_daydistribute byday ;
- 数据导入hive出现的问题记录
- hive导入数据出现NULL
- Hive 导入数据出现NULL
- 很诡异,给hive中的数据表导入数据,出现的问题?
- Hive的数据导入
- 使用sqoop导入导出mysql、hdfs、hive出现的问题
- 工作中,sqoop导入导出hive,mysql 出现的问题.
- hive导入数据丢失问题
- hive导入数据到hbase 遇到的问题
- mysql数据导入到hive遇到的问题
- hive 数据的导入导出
- hive-导入数据的方式
- hive并行导入数据锁问题
- MongoDB的数据导入到HDFS上的Hive中记录
- Hive安装出现的问题
- Hive 安装出现的问题
- hive安装出现的问题
- 记录一下Mysql中数据导入导出遇到的问题
- [转]XMPP协议、MQTT协议、HTTP协议、CoAP协议的基本比较
- MINGW安装时每个package下的意义
- JAVA reflect
- 字符串操作之strstr()函数实现
- Ajax的基本概念
- 数据导入hive出现的问题记录
- 初学c++的一些小记录(Mac下)
- 我的2016——程序员年到三十,工作第四年
- 读文件输出数字码串
- WiFi钥匙管家-免费上网神器
- Raspbian 中国软件源
- <img>标签的方方面面
- android AsyncTask
- 九度OJ学习笔记 题目1186