HIVE自定义函数类型

来源:互联网 发布:单片机1602显示器程序 编辑:程序博客网 时间:2024/05/16 09:57

编写代码

package UDF.UDFS_CLASS;import org.apache.commons.lang.StringUtils;import org.apache.hadoop.hive.ql.exec.UDF;import org.apache.hadoop.io.Text;public class UDFS extends UDF {public Text evaluate(Text str) {//input parameter(对日志文件分析,若为空则返回空,避免报错)if (str == null) {return null;}//     invilated(对数据分析,若为空则返回空,避免报错)if(StringUtils.isBlank(toString())){return null;}//Text result =new Text(str.toString().toLowerCase());String lineValue = str.toString();//转换大写为小写的函数        String[] strs = lineValue.toString().split("\t");Text result = new Text(strs.toString().replaceAll("\"", ""));将字符串中的所有双引号删除return result;}}

添加函数到hive

讲jar包放到hive文件夹中然后添加函数到hive的函数表

add jar /opt/cdh5.3.6/hive-0.13.1-cdh5.3.6/UFS_replace.jar ;

这里写图片描述

create temporary function UFS_replace as ' UDF.UDFS_CLASS.UDFS' ;

添加之后可以通过代码
show functions;来查看hive中所有函数
这里写图片描述

使用函数查询

select url,ufs_replace(url) ufs_url from db_udf_log;

这里写图片描述

0 0
原创粉丝点击