Hive使用注意事项(持续更新)
来源:互联网 发布:淘宝怎么搜烟 编辑:程序博客网 时间:2024/04/19 06:37
Hive是一个非常好用的东东。可以省去写MapReduce程序的痛苦。
一般来说,Hive可以覆盖90%的MapReduce任务的需求,大大减少开发代价。
但是使用Hive,有很多需要注意的地方。
本文会持续整理一些,帮大家避免一些问题。
1. 请不要使用Hive并行向同一个表的不同分区导入数据。
有人说,我想并行导入数据,这样可能快些。
Hive本身很好,但它的元数据一直是个软肋。
并行导入数据,就意味着需要并行访问元数据。这个是一个危险的操作。
Hive对元数据访问依赖于JDO的支持,而在并发情况下,JDO访问MySQL是存在bug的。
具体可参考:http://mail-archives.apache.org/mod_mbox/hive-user/201107.mbox/%3C4F6B25AFFFCAFE44B6259A412D5F9B1033183876@ExchMBX104.netflix.com%3E
建议的方法是,先通过hadoop客户端,并行的把数据导入到hdfs上。
然后在写一个脚本,串行的建表,建分区。
- Hive使用注意事项(持续更新)
- hive使用经验总结(持续更新中)
- Opencv函数使用注意事项(持续更新)
- SparkSQL+Hive(持续更新)
- jpa注意事项(持续更新)
- keil 软件的使用注意事项(持续更新中)
- Petalinux BSP使用中的问题及注意事项(持续更新)
- 使用jQuery的一些注意事项总结(持续更新......)
- hive常见命令(持续更新)
- Hive 常见问题(持续更新。。。)
- 关于论文的注意事项(持续更新)
- 一些技巧&套路&注意事项 (持续更新)
- es注意事项----持续更新
- hive 优化总结 持续更新
- 集成开发注意事项(持续更新)
- git使用(持续更新)
- vim使用(持续更新)
- MyEclipse使用(持续更新)
- 企业应用架构(.Net)
- 《桃姐》观后感
- cannot find gtk+/x11 2.4(or above version)!问题解决
- 谈在Debug和Release模式下输出调试信息
- make和makefile知识查漏补缺
- Hive使用注意事项(持续更新)
- 把桌面qt代码编译运行到qpe上的一个例子
- VC选项卡控件的使用方法
- Java初始化顺序
- 常用Js代码汇总
- linux下真正的"伪随机数"
- 方言
- android-仿美丽说有滑动效果的导航栏
- 散列表(HashTable)探秘 --中