pig udf实现

来源:互联网 发布:哪种网络机顶盒比较好 编辑:程序博客网 时间:2024/05/16 12:38

pig的UDF实现了用简单的pig命令难以实现的功能,一般是直接对tuple操作的。


而且这个有个好处是用户可以自己定义的。


自己写udf,要注意几点:

1. udf传入的参数是tuple。

2. udf操作时,有点类似于对group后的结果进行操作,我们可以对group内的每一个元素进行操作,但是你要记住,每一个元素是什么,这样你才能get(0),get(1)等等。

3. udf的使用,写好udf后,打包jar,我用的是java,然后使用时只要像正常的java调用一样,把class路径写出来,把参数传进去就行了。


具体还是要有实践,我觉得,我刚试着写第一个成功的udf,感觉更多的没有体会到其实。


原创粉丝点击