数据迁移工具--“水壶”(一)

来源:互联网 发布:ubuntu卸载jdk1.8 编辑:程序博客网 时间:2024/04/28 16:55

       也许这个名称听起来很陌生,但是数据迁移和数据转换都是大家耳闻能详的术语,而这个kettle就是为了更好的帮我们实现这些术语的工具;       

        kettle是“kettle    E.T.L  Envirnonment”首字母缩写;这也就意味着设计实现ETL需要抽取,转换,装入和加载数据(也叫装载数据);翻译成中文也就是水壶,这也正好影射出这个工具它的本意:希望把各种数据放在一个水壶里然后以一种指定的格式倒出(流出)。

        kettle它有三个主要组件:Spoon,Kitchen,Pan。其中Spoon是一个图形化的界面,用于windows的时候,先设置环境变量:pentaho_java_home,其实也就是引入电脑中的jdk的安装路径,比如 C:\Program Files\Java\jdk1.7.0_25;

     如果是Windows系统,则打开下载的文件中Spoon.bat运行;如果是linux系统,则打开Spoon.sh文件;这时会出现下述的界面:


       一个kettle资源库可以包含那些转换信息,这就意味着为了从数据库资源中加载一个转换,所以我们必须链接相应的资源库。而spoon在启动的时候,我们可以用资源库对话框来定义:

     

1.添加资源库:

    在图1中点击图片中右上角的加号:

     

     然后做下图中的操作:

    

     测试通过之后点击OK会回到软件的初始界面,然后选择我们已经创建好的test数据库,将数据库的id和名称输入:

    

    之后我们一路next下去就可以了:最后会弹出下面的对话框:

    

     点击“执行”,会在登录的用户下建立很多表。

    关于“水壶”的介绍就先到这里,后续小编会有一系列的关于spoon的介绍博客,敬请期待!!

    

  

1 0