在Oozie 中调度执行shell、hive 脚本,以及通过shell脚本执行hive/sqoop/shell脚本的方法

来源:互联网 发布:游族网络 林奇车祸 编辑:程序博客网 时间:2024/05/17 06:31

  最近项目需要用到OOzie工具,可是找了好久,也没有找到一个完整的、统一的解决和部署方案。经过努力,终于打通了其中的所有环节,解决了各种坑爹的问题。

  首先,就项目需求做一个简单的介绍:

     项目需要从mysql中导入数据到hive进行离线计算后,再导回到mysql。过程很简单,所有流程通过shell脚本实现了调度。

  

问题描述:shell调度脚本执行很好,但是放到Oozie上调度执行,却发现了各种坑。第一个大坑页面上运行结果显示成功,但是结果表中却并没有数据。显然,执行的过程中肯定有环节出了问题。

解决策略: 将调度脚本中的各个流程分拆开来,单独放到一个shell脚本中,然后用Oozie调度执行。具体分拆步骤如下:

一、shell 脚本中执行shell脚本。

     在cloudera 的官网(http://gethue.com/use-the-shell-action-in-oozie/)上给出了一个demo,但是只是执行shell脚本自身。那对于shell脚本中执行shell脚本的情况,与demo中的方法类似。也要指明shell脚本的名称以及路径。如图1所示:

    需要注意的是:1、文件的权限必须具有可执行权限。本例采用了“777”权限。 2、第一个输入框处填包含后缀的文件名,文件部分的输入框要包含调度脚本和被调度脚本的完整文件名(包含路径和后缀),且都具有可执行权限。

   

                                                                       图1  shell脚本中包含shell脚本


二、执行hive脚本。

    在图2中的第一个输入框输入hdfs上的hive脚本完整路径加上文件名(含后缀),hive XML输入框部分输入hive-site.xml文件的路径。也可以点击界面右上角的设置按钮,对hive-site.xml文件进行全局设置。如图3所示。需要注意的是:1、上传hive-site.xml文件至hdfs (本例为/user/admin/),且权限为755.权限太高不会认。 3、此处的hive-site.xml 文件为”/opt/cloudera-manager/cm-5.4.7/run/cloudera-scm-agent/process/650-oozie-OOZIE_SERVER/hive-conf/hive-site.xml“。查找的办法为:find /opt -name hive-site.xml 。如图2所示


图2  oozie执行hive脚本


                                         图3   hive-site.xml文件全局设置


3、shell脚本中执行hive脚本

       过程与shell执行shell类似。不过需要注意的是,如果没有对job进行图3所示的全局设置,则需要在文件部分添加hive-site.xml文件。此处略。


4、shell 执行sqoop命令

         oozie 本身可以直接执行sqoop命令,但是比较讨厌的是,一种是要输入很多很多的参数,一种是不能够包含参数中不能包含空格。而且不支持动态传参数,比如说每天自动执行sqoop命令。因此,理想的办法自然是放在shell脚本中调度。

        执行的方法,说白了,其实也很简单。跟shell调度shell 类似。不过需要注意的是:

1、sqoop导入数据到hive中,那hive指定的仓库的路径或外部表所在的路径一定要可写 ,最好设置为766.否则导入的文件无法写人指定目录,而一旦出错,通过oozie的日志,也很难定位错误的地方。

         2、如果是导入具有多分区的分区表,则第一级分区的目录的权限必须设置为可写,如766,该过程在shell脚本中,执行sqoop命令前就必须设置好。第二级分区的文件目录则无所谓。 本例中的设置如图4所示:

     

图4  shell调度执行sqoop命令


          5、shell脚本同时调度执行hive/sqoop/shell脚本

                 方法同以上。需要注意的几点:1、必须包含所有的文件。  2、所有文件必须在同一目录下。在shell脚本中动态获取的目录不起作用,如shell和hive脚本置于不同目录,执行的时候,就无法执行hive脚本。 3、文件权限问题。 4、虽然在本例测试的过程中,发现不用包含hive-site.xml文件可以正常执行,为防万一,建议各位加上。本例中的配置如图5所示:


   

                                                 图5   shell调度hive、shell、sqoop脚本    

      

0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 脚起泡泡很痒怎么办 脚痒还有小泡泡怎么办 外阴长了肉疙瘩怎么办 嘴巴里泡泡破了怎么办 脚上泡泡破了怎么办 脸被自己扣破了怎么办 6s安装不了软件怎么办 苹果6s特别卡怎么办 苹果手机4g网慢怎么办 大王卡玩王者卡怎么办 荣耀7c手机卡顿怎么办 华为6x手机卡顿怎么办 荣耀7c手机老卡怎么办 苹果6打王者卡怎么办 电脑玩游戏显示显卡不行怎么办 笔记本玩游戏显卡不行怎么办 笔记本玩英雄联盟有点卡怎么办 英语考试作文抄了阅读理解怎么办 qq账号被盗怎么办很久了 想玩线上德州没有渠道怎么办 手机玩久了头晕怎么办 玩3d游戏头晕恶心怎么办 win10打cf没声音怎么办 英雄联盟玩家尚未准备就绪怎么办 玩手机想吐应该怎么办 玩手机多了头晕怎么办 玩cf老是无响应怎么办 玩穿越火线好卡怎么办 绝地求生画质卡顿怎么办 手机热点玩lol卡怎么办 一加6直播触手黑屏怎么办 ipad应用商店密码忘记了怎么办 爱派忘记了密码怎么办 爱派id密码忘了怎么办 爱派密码忘了怎么办 爱派的密码忘了怎么办 苹果爱派密码忘了怎么办 鼠标无法识别的usb设备怎么办 电脑鼠标无法识别usb设备怎么办 win7电脑用户密码忘了怎么办 联想win7旗舰版开不了机怎么办