hive建表存储格式造成的问题
来源:互联网 发布:网络学硬笔书法 编辑:程序博客网 时间:2024/06/05 06:47
用create table tableY as select 字段A,regexp_extractA,字段B,regexp_extractB from tableX 之后,
数据比原来多了5条
经查找,这5条都是其中一个字段为NULL,另外的字段全部=''
百思不得其解
将tableY用建表语句指定rcfile格式建表后,insert into table select 重新插入数据,就不会出现数据多的情况了
具体原因待查
这是源表的建表格式
ROW FORMAT SERDE'org.apache.hadoop.hive.serde2.columnar.LazyBinaryColumnarSerDe'
STORED AS INPUTFORMAT
'org.apache.hadoop.hive.ql.io.RCFileInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.RCFileOutputFormat'
0 0
- hive建表存储格式造成的问题
- Hive的存储格式
- hive建表的格式问题
- hive表的存储格式; ORC格式的使用
- Hive的数据存储格式
- 时钟问题造成的hive运行错误
- Hive 不同存储格式表数据同步问题
- hive建表没使用LZO存储格式,但是数据是LZO格式时遇到的问题
- Hive 数据类型和存储格式、建表操作
- HIVE文件存储格式的测试比较
- HIVE文件存储格式的测试比较
- hive的3种数据存储格式
- HIVE文件存储格式的测试比较
- hive的3种数据存储格式
- Hive文件存储格式的测试比较
- hive存储读取json格式的数据
- Hive文件存储格式的测试比较
- Hive文件存储格式的测试比较
- maven构建eclipse工程的编码问题
- c++ 使用throw抛出异常
- 在html中打开app
- BZOJ 4264 小C找朋友
- HDU 5444 Elven Postman(重建二叉树)
- hive建表存储格式造成的问题
- phpfpm使用自带的status优化步骤
- SSh爆破类 Fucksshexploit 工具-ssh连接类
- 用IT技术玩金融系列文章
- ODI自带工具-----OdiOutFile生成文件等
- 程序员应该遵守的编程原则
- 如何添加sdk包中的jar包
- Scala中Manifest、ClassTag、TypeTag的学习
- springMVC + mybatis 事务配置