Trafodion 数据加载介绍
来源:互联网 发布:淘宝开店类目如何选择 编辑:程序博客网 时间:2024/05/17 04:40
Trafodion 的数据加载主要包括两种方法,即 Trickle Load(持续加载) 和 Bulk Load(批量加载)。
下表介绍了两种加载方法的区别,
描述
方法/工具
Trickle Load
数据量较小
立即插入
ODB 工具(性能通常较第三方ETL工具更好)
ETL 工具如kettle、Informatica等
自主开发的ODBC/JDBC应用
Bulk Load
数据量较大
阶段性数据并且是批量加载的方式
Bulk Loader
从SQL插入语句实现方式来看,
Trickle Load 又包括以下三种方式,
- INSERT
- UPSERT
- UPSERT USING LOAD
而Bulk Load主要的SQL命令为,
- LOAD
以上4种SQL实现加载方式区别如下表,
INSERT
UPSERT
UPSERT USING LOAD
LOAD
事务
是
是
不是,使用HBase的WAL来恢复
不是,使用快照(SNAPSHOT)来恢复
操作方法
通过CheckAndPut调用走标准HBase写路径
通过Put调用走标准HBase写路径
通过Put调用走标准HBase写路径
使用HBase bulk load写路径并直接创建HFiles
唯一性约束
强制
不强制,有相同键值的覆盖之前的行
不强制,有相同键值的覆盖之前的行
部分强制
索引
可以用在有索引的表上
可以用在有索引的表上
当用在有索引的表上时,会回到UPSET
可以用在有索引的表,索引会不起作用
最大Size
10k*n 行,n代表节点数
10k*n 行,n代表节点数
5million*n 行,n代表节点数
2 billion*n行,n代表节点数
最小Size
1行
1行
1行
1million*n行
速度
最慢
比INSERT快
比UPSERT快
最快
1 0
- Trafodion 数据加载介绍
- Trafodion数据加载性能测试
- Trafodion 性能优化之加载数据
- Trafodion DCS 架构介绍
- Trafodion 主要进程介绍
- Trafodion UNLOAD导出数据
- Trafodion 使用odb加载中文
- Dbvisualizer 向Trafodion导入数据
- Trafodion 处理JSON半结构化数据
- Trafodion 元数据获取数据库所有表
- Trafodion 更新统计信息数据收集
- Trafodion 使用hash2partfunc查看数据倾斜
- Trafodion 集成R实现数据可视化
- trafodion表元数据破坏,hbase数据正常情况下恢复trafodion表数据步骤
- 用Kettle从MySQL迁移数据到Trafodion牛刀小试
- Trafodion ETL工具odb进行数据load方法及性能
- Kettle实现Oracle到Trafodion数据定时抽取
- 使用HBase Snapshot恢复Trafodion误删数据
- AJAX学习笔记
- JUC (Java Util Concurrency) 基础内容概述
- HDU - 2516 取石子游戏(斐波那契)
- 我的第一个Go网络程序,有点不完美
- jQuery学习笔记
- Trafodion 数据加载介绍
- 如何验证页面上GA监测代码是否添加正确
- poj2167 Irrelevant Elements
- WeUI测试代码
- Avro 序列化
- vim tips: 执行外部命令
- Leetcode104: Maximum Depth of Binary Tree
- Atitit 面向对象编程(OOP)、面向组件编程(COP)、面向方面编程(AOP)和面向服务编程(SOP)的区别和联系
- Linux学习(CentOS-7)---Linux开机流程