正则表达式笔记
来源:互联网 发布:我好想你网络歌手 编辑:程序博客网 时间:2024/05/27 14:13
1.所谓组,即你查一次,可以查多种匹配的结果,每种结果即是一组
eg.
import repattern = re.compile(r'<div(.*?>)(.*?)</div>')match = pattern.match('<div class="test">Hello <div>wa haha<div>test xxx</div></div>world</div>')if match: print match.group(2) print match.group(1) print match.group(0)>>> ================================ RESTART ================================>>> Hello <div>wa haha<div>test xxx class="test"><div class="test">Hello <div>wa haha<div>test xxx</div>>>>其中group(0)比较特殊,所有组的合集
2.查找一个文件中所有的http(url)地址
import reimport urllib2f = open('url.txt','r')string = ""while 1: line = f.readline() if not line:break string += linef.close()urls = re.findall('http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', string)
3.正则表达式中的空格包括\t\r\n\f\v等几种字符
0 0
- 正则表达式学习笔记
- 正则表达式学习笔记
- 正则表达式学习笔记
- 正则表达式学习笔记
- 正则表达式学习笔记
- 正则表达式学习笔记
- 正则表达式学习笔记
- 正则表达式学习笔记
- 正则表达式笔记等
- 正则表达式学习笔记
- 正则表达式资料笔记
- 正则表达式学习笔记
- 正则表达式学习笔记
- 正则表达式学习笔记
- 正则表达式学习笔记
- 学习正则表达式笔记
- 正则表达式学习笔记
- 学习正则表达式笔记
- Maven 项目不打包 *.hbm.xml 映射文件
- SlidingMenu常用属性设置记录
- poj 3390 Print Words in Lines 动态规划
- Unity3D 里IK手柄的用运
- 两个页面之间Bundle传值
- 正则表达式笔记
- 玩转大数据系列之Apache Pig高级技能之函数编程(六)
- 挑战2.1 Smallest Difference
- 黑马程序员--多线程
- 5、构造器、类变量和单例
- c++运算符重载
- 116.Populating Next Right Pointers in Each Node
- Jquery面试题整合
- 跟Android说Hello World