hive正则表达式
来源:互联网 发布:以父之名 知乎 编辑:程序博客网 时间:2024/05/21 08:51
hive中实现正则表达式,与java中的正则表达式有所区别:
这里经过探索总结了一些:
hive中的正则可以用,但是有所区别,区别在于原来的‘\’ 转义,这里变成了双斜杠了‘\\’
hive中的正则解析函数:regexp_extract; 例如:‘匹配 10.122.248’
select regexp_extract(host,'(^[\\w]+)\\.([\\w]+)\\.([\\w]+)',0) aa from browsewebpagelog where dtlike '20140630%';
第一参数:要处理的字段,第二参数需要匹配的正则表达式,第三个参数:0是显示与之匹配的整个字符串,1,是显示第一个括号里面的,2是显示第二个括号里面的字段...
语法: regexp_extract(string subject, string pattern, int index)
返回值: string
说明:将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符。注意,在有些情况下要使用转义字符
举例:
hive> select regexp_extract(‘foothebar’, ‘foo(.*?)(bar)’, 1) from dual;
the
hive> select regexp_extract(‘foothebar’, ‘foo(.*?)(bar)’, 2) from dual;
bar
hive> select regexp_extract(‘foothebar’, ‘foo(.*?)(bar)’, 0) from dual;
foothebar
注:有些博客上用 rlike匹配正则,我试过它的含义是只要出现你所制定的正则时,都给你匹配上,你必须添加开始‘^’的符号,否则匹配的结果绝对不是所期望的。
- hive中的正则表达式
- hive正则表达式
- hive正则表达式
- hive 正则表达式详解
- Hive中的正则表达式
- Hive(五)--正则表达式
- hive 正则表达式详解
- hive正则表达式详解
- Hive 正则表达式使用 与 匹配中文
- Hive正则表达式对数据过滤
- 关于hive引用正则表达式建表的格式
- Hive 建表结合正则表达式的案例
- 使用Hive的正则表达式匹配数据时为NULL
- hive正则表达式regexp_extract的第三个参数index
- hive 正则
- 【正则表达式】正则表达式
- 作业电影评分系统 HIVE实战 正则表达式(限于string)解决了HIVE 源文件多个分隔符的问题
- hive中使用正则表达式不当导致运行奇慢无比
- 【bzoj2006】【NOI2010】【超级钢琴】
- 根据日期得到当月第一天和最后一天
- myeclipse10 vss
- 收集网址
- 日期时间操作总结
- hive正则表达式
- 欢迎使用CSDN-markdown编辑器
- iOS:机型参数、sdk、xcode各版本
- DWR 过滤器验证权限
- centos引导项的重建
- 0710 测试测试测试blog
- 科学家对偏置并不是视而不见
- Thread与Warp
- 代码扫描事项和resin绑定多ip