hive udf (python)
来源:互联网 发布:网络红歌2016火爆歌曲 编辑:程序博客网 时间:2024/05/17 18:47
searchstr_map.py
#!/usr/bin/env python#coding:utf-8import sysimport refor line in sys.stdin: line = line.strip() fields = line.split("\t") cityid = str(fields[0]) searchstr = fields[1] pv = str(fields[2]) qrys = re.findall(r'([a-z][\-_.0-9]+)', searchstr) qrys.sort() sorted_str = ''.join(qrys) print '%s\t%s\t%s\t%s' % (cityid, searchstr, sorted_str, pv)
hive 命令行使用:
add file searchstr_map.pyselect TRANSFORM (src.cityid, src.searchstr, src.pv) USING 'python searchstr_map.py' AS (cityid, searchstr, sorted_str, pv) from(select if(cityid='1', 0, cast(cityid as int)) cityid, a.searchstr, count(1) pvfrom (select split(request['cityid'], ',') cityid_arr, request['searchstr'] searchstrfrom db.tablename where dt_ymd=20170731and request_ser like '%/search/carinfo%'and request['searchstr'] is not null and request['searchstr'] <> '') alateral view explode(a.cityid_arr)t as cityidwhere cityid rlike '^[0-9]+$'group by if(cityid='1', 0, cast(cityid as int)), a.searchstr) src
阅读全文
0 0
- hive udf (python)
- Hive UDF Python
- Python实现Hive的UDF
- HIVE UDF(1)
- #hive#HIVE中使用python实现UDF
- Spark(Hive) SQL中UDF的使用(Python)
- hive的UDF (2)
- Hive UDF教程(一)
- Hive UDF教程(二)
- Hive UDF教程(三)
- 使用Python实现Hive的UDF示例
- hive udf
- hive-udf
- hive UDF
- hive UDF
- hive UDF
- hive udf
- hive udf
- CodeForces
- php学习
- 文件打包压缩与远程传输
- 饿了么项目---10、(2)vue2.0给嵌套的元素做多个动画
- tr命令详解
- hive udf (python)
- MOOC清华《面向对象程序设计》第3章:const常量成员实验
- 市区对应的编码获取入库过程
- 算法题/旋转数组
- 最大报销额(背包01)
- mac下常用的命令
- CXF+Spring+Maven之服务端
- Gem-based Jekyll theme 开发小记
- CNTK API文档翻译(17)——多对多神经网络处理文本数据(1)