ETL工具部署Linux系统的简易方法

来源:互联网 发布:任子行网络怎么样 编辑:程序博客网 时间:2024/05/22 10:37

1.下载pentaho的数据清洗工具Data-Integration,http://community.pentaho.com/

2.上传到linux计算服务器

3.为data-integration目录下的脚本赋可执行权限 chmod +x *.sh

4.在安装用户的家目录下的.kettle隐藏文件中添加.spoonrc(如果不在linux下进行视窗操作则不需要该文件),kettle.properties(参数配置文件),repositories.xml(资源库配置文件,kjb文件的执行命令为kitchen.sh -rep=etl_rep -job=相对路径 -param:exeDate=2014-10-01,job不需要导出为链接资源的xml文件,通过svn管理job)

repositories.xml文件需要如下的

<repository>
     <id>KettleFileRepository</id>
     <name>etl_rep</name>
     <description></description>
     <base_directory>doc_directory</base_directory>
     <read_only>N</read_only>
     <hides_hidden_files>N</hides_hidden_files>
  </repository>

0 0
原创粉丝点击