Hive UDF开发(多个参数)
来源:互联网 发布:免费的网络验证哪个好 编辑:程序博客网 时间:2024/05/21 10:47
Hive进行UDF开发十分简单,此处所说UDF为Temporary的function,所以需要hive版本在0.4.0以上才可以。
Hive的UDF开发只需要重构UDF类的evaluate函数即可。例:
package com.sohu.hive.udf;import org.apache.hadoop.hive.ql.exec.UDF;public class Md5 extends UDF {public String evaluate(String url,Integer num) {try {return MD5Util.getMD5Str(url).substring(0,num-1);} catch (Exception e) {e.printStackTrace();return url;}}}
将该java文件编译成md5.jar
hive>add jar md5.jar;
hive>create temporary function md5 as 'com.sohu.hive.udf.Md5';
hive>select md5(url,10) from focuspvlog limit 2;
hive>drop temporary function md5
注:
- md5为临时的函数,所以每次进入hive都需要add jar以及create temporary操作
- UDF只能实现一进一出的操作,如果需要实现多进一出,则需要实现UDAF
- Hive UDF开发(多个参数)
- Hive UDF开发(单个参数)
- 开发hive UDF函数
- Hive UDF 开发
- hive UDF开发注意事项
- hive开发UDF随记
- Hive UDF开发
- 开发hive UDF函数
- Hive UDF开发
- hive的udf开发
- Hive UDF开发指南
- Hive UDF开发
- hive UDF函数开发
- 开发hive UDF
- Hive UDF开发
- hive UDF开发实例
- Hive UDF开发
- Hive开发UDF
- 【Lucene实战】初始Lucene
- 三代基因组测序技术原理简介
- Latex论文排版( 一)
- UML类图关系大全
- 统计知识选讲(三)——因子分析的思想
- Hive UDF开发(多个参数)
- Java中接口与抽象类的区别
- 【Lucene实战】构建索引
- C语言函数指针基础
- 【Lucene实战】添加搜索功能
- 解决网站大流量问题的策略
- struts.enable.DynamicMethodInvocation
- 题目1163:素数
- 思维导图