hive ORC 文件存储格式

来源:互联网 发布:淘宝卖家怎么用淘宝客推广 编辑:程序博客网 时间:2024/06/09 19:27


   ORC file format,它的全名是Optimized Row Columnar (ORC)  file format。使用ORC文件格式提升Hive读、写与处理数据的性能。

    存储方式为数据按行分块,每块按照列存储

     压缩快 快速列存取

     效率比rcfile高,是rcfile的改良版本


    具体可以参考官网:

     https://cwiki.apache.org/confluence/display/Hive/LanguageManual+ORC

2 0