Kettle使用介绍
来源:互联网 发布:演示动画制作软件 mac 编辑:程序博客网 时间:2024/04/30 04:22
Main Tree菜单列出的是一个transformation中基本的属性,可以通过各个节点来查看。
DB连接:显示当前transformation中的数据库连接,每一个transformation的数据库连接都需要单独配置。
Steps:一个transformation中应用到的环节列表
Hops:一个transformation中应用到的节点连接列表
Core Objects菜单列出的是transformation中可以调用的环节列表,可以通过鼠标拖动的方式对环节进行添加。
Input:输入环节
Output:输出环节
Lookup:查询环节
Transform:转化环节
Joins:连接环节
Scripting:脚本环节
类别
环节名称
功能说明
Input
文本文件输入
从本地文本文件输入数据
表输入
从数据库表中输入数据
获取系统信息
读取系统信息输入数据
Output
文本文件输出
将处理结果输出到文本文件
表输出
将处理结果输出到数据库表
插入/更新
根据处理结果对数据库表机型插入更新,如果数据库中不存在相关记录则插入,否则为更新。会根据查询条件中字段进行判断
更新
根据处理结果对数据库进行更新,若需要更新的数据在数据库表中无记录,则会报错停止
删除
根据处理结果对数据库记录进行删除,若需要删除的数据在数据库表中无记录,则会报错停止
Lookup
数据库查询
根据设定的查询条件,对目标表进行查询,返回需要的结果字段
流查询
将目标表读取到内存,通过查询条件对内存中数据集进行查询
调用DB存储过程
调用数据库存储过程
Transform
字段选择
选择需要的字段,过滤掉不要的字段,也可做数据库字段对应
过滤记录
根据条件对记录进行分类
排序记录
将数据根据某以条件,进行排序
空操作
无操作
增加常量
增加需要的常量字段
Scripting
Modified Java Script Value
扩展功能,编写JavaScript脚本,对数据进行相应处理
Mapping
映射(子转换)
数据映射
Job
Sat Variables
设置环境变量
Get Variables
获取环境变量
Main Tree菜单列出的是一个Job中基本的属性,可以通过各个节点来查看。
DB连接:显示当前Job中的数据库连接,每一个Job的数据库连接都需要单独配置。
Job entries:一个Job中引用的环节列表
Job entries菜单列出的是Job中可以调用的环节列表,可以通过鼠标拖动的方式对环节进行添加。
每一个环节可以通过鼠标拖动来将环节添加到主窗口中。
并可通过shift+鼠标拖动,实现环节之间的连接。
类别
环节名称
功能说明
Job entries
START
开始
DUMMY
结束
Transformation
引用Transformation流程
Job
引用Job流程
Shell
调用Shell脚本
SQL
执行sql语句
FTP
通过FTP下载
Table exists
检查目标表是否存在,返回布尔值
File exists
检查文件是否存在,返回布尔值
Javascript
执行JavaScript脚本
Create file
创建文件
Delete file
删除文件
Wait for file
等待文件,文件出现后继续下一个环节
File Compare
文件比较,返回布尔值
Wait for
等待时间,设定一段时间,kettle流程处于等待状态
Zip file
压缩文件为ZIP包
- Kettle使用介绍
- Kettle使用介绍
- Kettle使用介绍
- kettle介绍
- kettle介绍
- kettle介绍
- kettle介绍
- kettle介绍
- kettle介绍
- kettle介绍
- kettle介绍
- kettle介绍
- Kettle使用
- kettle使用
- ETL利器Kettle实战应用解析系列一【Kettle使用介绍】
- ETL利器Kettle实战应用解析系列一【Kettle使用介绍】
- ETL利器Kettle实战应用解析系列一【Kettle使用介绍】
- ETL利器Kettle实战应用解析系列一【Kettle使用介绍】
- python学习小结2:if和while控制语句
- 搜索引擎选择: Elasticsearch与Solr
- 第5周 项目5-后缀式表达
- python学习小结3:函数
- python学习小结4:类
- Kettle使用介绍
- 机器学习实战
- python学习小结5:封装、继承、多态
- python学习小结6:模块
- Swift 可选值(Optional Values)介绍
- 第5周项目1-建立顺序栈算法库
- python学习小结7:变量类型
- 反向代理
- python学习小结8:I/O