hive MV速度慢的问题
来源:互联网 发布:百度云mac版 编辑:程序博客网 时间:2024/06/09 05:58
事件: 执行一个HIVE查询,在执行到 hive 的 moving data 过程就卡住了,早上来的时候看执行还在那个位置。
截屏如下:
运行程序服务器: hadoop@szwg-scloud-2015q2-c32-su06.szwg01.baidu.com
处理方法:在hive-site.xml中添加以下参数。
<property>
<name>hive.exec.stagingdir</name>
<value>/tmp/hive/.hive-staging</value>
</property>
这个参数默认是<value.hive-staging</value> 会在输出目标目录下先建立一个sessionid目录用于临时存放执行结果。
hive最后在mv的时候,原目录是目标目录的子目录,原目录下的每个文件进行copy操作,如果文件大于默认值(32MB),则会进行distcp操作。如果copy操作,那么数据经过客户端读写一次,如果distcp那么会提交一个任务,不论哪种速度都会非常慢。
hive的MV策略如下:
1.原文件是非hdfs文件,copyFromLocal
2.原文件是hdfs文件
2.1 Encrypted模式
copy操作,如果文件大于默认值(32MB),则会进行distcp操作。
2.2 非Encrypted模式
(1)原目录是目标目录的子目录,原目录下的每个文件进行copy操作,如果文件大于默认值(32MB),则会进行distcp操作。
(2)其他情况,进行mv操作。
0 0
- hive MV速度慢的问题
- ssh 速度慢的问题
- summary 速度很慢的问题
- 彻底解决南北互访速度慢的问题
- RCP启动速度慢问题的解决
- Debian下上网速度慢的问题
- 火狐启动速度慢的问题
- 解决SSH连接速度慢的问题
- 连接ssh速度慢的问题
- 解决VS2010速度慢的问题
- 解决RSA速度慢的问题
- Mac系统启动速度特别慢的问题
- MySQL 局域网访问速度慢的问题
- Android sdk下载速度慢的问题
- myeclipse启动tomcat速度慢的问题
- VS2010调试速度很慢的问题
- Mac系统npm速度慢的问题
- 解决github访问速度慢的问题
- 将父试图设置为透明而其里面的内容不透明的方法
- C++重载、覆盖、隐藏 分析
- 输入/输出(I/O)管理
- 一些常用网址
- 最简单的servlet开始学起
- hive MV速度慢的问题
- lua next 用法 table 空的判断
- 文件操作
- lsc调试工具lc44_Nov26_2014使用
- xCode断点变量全是nil
- LeetCode总结
- adams参数化优化设计例子
- 搭建gradle web项目模板
- C++对象模型