HDP 2.2.4 Hue Oozie Editor生成workflow.xml的几点问题

来源:互联网 发布:周琦体测数据曝光 编辑:程序博客网 时间:2024/06/11 21:25

本文原文出处: http://blog.csdn.net/bluishglc/article/details/45888279 严禁任何形式的转载,否则将委托CSDN官方维护权益!

如果你想让你手写的workflow.xml成功的倒入到Hue的Oozie Designer里,你需要注意如下几点:

  1. 关于chema的版本:oozie最高只能是0.4,hive-action最高只能是0.2, istcp-action最高只能是0.1!!

  2. 对于jobTracker和nameNode属性,hue的oozie designer生成的workflow.xml文件是hard code使用的!!也就是说:如果我手写的xml想要导入到oozie中,只能在workflow.xml文件使用${jobTracker}和${nameNode},而不可以直接写出它们对应的值以及自己定义的属性名!

  3. 关于路径一类的参数更是让人捉摸不定,比如有的地方接受${nameNode}为前缀的地址,而有的地方则不能正确解析以${nameNode}为前缀的地址! 下面的这段配置是由Oozie Editor生成的,我们可以看到,同样的HDFS路径,delete 和 mkdir 是以${nameNode}为前缀的,而arg则没有。随意修改这些地址格式有可能导致你的工作流无法被导入。

<prepare>    <delete path="${nameNode}/home/hduser/export/ipam_db/ipam${year}${month}"/>    <mkdir path="${nameNode}/home/hduser/export/ipam_db/ipam${year}${month}"/></prepare><arg>/apps/hive/warehouse/ipam.db/ipam${year}${month}/*</arg><arg>/home/hduser/export/ipam_db/ipam${year}${month}/</arg>
  1. coordinator没有import/export功能。

  2. dataset的timezone无法保存,保存之后再打开,依然是默认timezone.

  3. 定义input(events)只能在工作流参数和dataset之间进行直白的一一绑定,无法进行形如${coord:current(-1)}的偏移计算。这是一个非常糟糕的问题!

终上所述:

最好的做法是:先用Oozie Editor生成workflow.xml,然后再添加到工程中进行版本控制!

1 1