正则表达式与pythonRE库的使用
来源:互联网 发布:阿里旺旺for mac 10.9 编辑:程序博客网 时间:2024/06/12 20:14
1-正则表达式
正则表达式(Regular Expression):用于一种语法格式简洁表达一组字符串。正则表达式在处理文本中非常有用,识别病毒,字符串匹配等等。
2-正则表达式常用操作符。
3-经典正则表达式
表示由26个字母组成的任意字符串,^和$表示字符串的首尾匹配,表明这个是用来表示匹配字符串
^[A-Za-z]+$
表示由26个字母和数字组成的任意字符串
^[A-Za-z0-9]+$
表示整数形式的字符串
^-?\d+$
使用了UTF-8编码表示中文字符
[\u4e00-\u9fa5]
4-Python标准库re库
参数解释:
pattern表示正则表达式的字符串
string待匹配的字符串
flag控制标记,默认0,可选控制标记有:
- re.I 忽略大小写匹配
- re.M ^操作符是表示从字符串的开头开始匹配,使用了re.M的标记之后可以从每行的字符串开头开始匹配
- re.S .操作符默认匹配除换行符外的所有字符,使用该标记后,也适用于换行符。
maxsplit通俗的理解就是从字符串首部开始匹配出maxsplit个pattern,然后将匹配的这几个挖掉,原字符串就变成maxsplit+1份了。
repl用于替换匹配到的子串
count表示替换的最大个数,默认为0表示全部替换
5-re库使用技巧
5-1-调用两种方法:
简单调用
s = re.match(r'\d+','123abc')
面向对象调用
s = re.compile(r'\d+')m = s.match('123abc')
5-2-匹配原则
贪婪匹配,匹配第一个符合条件且最长的字符串
ss = re.search(r'p.*y','psyxxy')
输出结果ss.group(0) = ‘psyxxy’
最小匹配,匹配第一个符合条件切最短的字符串
ss = re.search(r'p.*?y','psyxxy')
输出结果ss.group(0) = ‘psy’
**通过添加?操作符进行最小匹配和贪婪匹配切换
阅读全文
0 0
- 正则表达式与pythonRE库的使用
- ATL正则表达式库与CAtlRegExp的使用(转)
- ATL正则表达式库与CAtlRegExp的使用
- lex的使用与正则表达式
- js正则表达式的使用与详解
- 正则表达式与Cookie的使用
- MYSQL-通配符与正则表达式的使用
- java正则表达式的使用与模板
- 正则表达式的使用
- 正则表达式的使用:
- 正则表达式的使用
- 正则表达式的使用
- 正则表达式的使用
- 正则表达式的使用
- 正则表达式“/”的使用
- 正则表达式的使用
- 正则表达式的使用
- 正则表达式的使用
- Mybatis循环插入报数据库连接超过最大数
- while循环嵌套练习
- 类成员和实例成员的访问
- Android学习路之TextView
- const与指针、引用
- 正则表达式与pythonRE库的使用
- java的classpath的设置
- DDR3内存详解,存储器结构+时序+初始化过程
- 软件工程(C编码实践)学习总结——中国科学技术大学孟宁老师主讲!
- PAT甲级真题及训练集(2)--1065. A+B and C (64bit) (20)
- linux下添加用户并赋予root权限
- eclipse maven 搭建【SSH】项目
- 量化进阶——多策略量化回测实录(二)
- 如何快速开发出一个高质量的APP——创业谈