[笔记]python爬虫:正则表达式库re
来源:互联网 发布:bear煮粥煲汤淘宝 编辑:程序博客网 时间:2024/05/20 23:56
1.正则表达式的语法:
正则表达式的常用操作符:
2.re库的基本使用:
re.search(pattern, string, flags=0)
作用:在字符串中搜索匹配正则表达式第一个位置
范例:
match=re.search(r'[1-9]\d{4}', 'BIT 10081')if match: print(match.group(0))
re.match(pattern, string, flags=0)
作用: #在字符串中的开始位置起匹配正则表达式
范例:
match1=re.match(r'[1-9]\d{4}', '10081 BIT')match2=re.match(r'[1-9]\d{4}', 'BIT 10081')if mathc1: print(match1.group(0))if match2: print(match2.group(0))
re.findall(pattern, string, flags=0)
作用:搜索字符串,以列表类型返回全部匹配字符串
范例:
ls=re.findall(r'[1-9]\d{4}', 'BIT10081 TS10084')print(ls)
re.split(pattern, string, maxsplit=0, flags=0)
作用:将一个字符串安正则表达式匹配结果分割
范例:
re.split(r'[1-9]\d{4}', 'BIT10081 TSU10084')re.split(r'[1-9]\d{4}', 'BIT10081 TSU10084', maxsplit=1)
re.finditer(pattern, string, flags=0)
作用:搜索字符串,返回一个匹配结果的迭代类型
范例:
for m in re.finditer(r'[1-9]\d{4}', 'BIT10081 TSU10084'): if m: print(m.group(0))
re.sub(pattern, repl, string, count=0, flags=0)
作用:在一个字符串中替换所有匹配正则表达式的子串
范例:
re.sub(r'[1-9]\d{4}', ':zipcode', 'BIT10081 TSU10084')
3.re库的一种等价用法
print('表达式1:')rst=re.search(r'[1-9]\d{4}', 'BIT10081')print('等价表达式2:')pat=re.compile(r'[1-9]\d{4}')rst=pat.search('BIT10081')
4.re库的match对象
match对象的属性:
match对象的方法:
5.re库的贪婪匹配和最小匹配
print('re库默认贪婪匹配,输出最长匹配字符串:')match=re.search(r'py.*n', 'pyanbncndn')match.group(0)
最小匹配:
print('最小匹配字符串:')match=re.search(r'py.*?n', 'pyanbncndn')match.group(0)
该问参考中国大学MOOC课程 《python网络爬虫与信息提取》
阅读全文
0 0
- [笔记]python爬虫:正则表达式库re
- python爬虫之re正则表达式库
- 爬虫---正则表达式:re库
- Python Re正则表达式笔记
- 从零开始写Python爬虫 --- 1.4 正则表达式:re库
- Python学习笔记--正则表达式,re模块
- 20161003 Python笔记之正则表达式 re
- python学习笔记正则表达式re模块
- Python 正则表达式 re 模块简明笔记
- Python 正则表达式 re 模块简明笔记
- Python正则表达式re模块简明笔记
- 【学习笔记】Python中的正则表达式re
- Python爬虫实践(八):正则表达式re模块(2)
- python爬虫02 re模块与正则表达式
- Python爬虫正则表达式和re模块系列之七
- python爬虫入门(1) 基础知识 ; 正则表达式 Re 模块
- Python 正则表达式 re
- python-re【正则表达式】
- 欢迎使用CSDN-markdown编辑器
- java se TCP转换大写服务器
- csdn如何转载别人的文章
- iOS把UIImage对象保存到本地沙盒
- pip安装trensorflow,以及遇到的坑
- [笔记]python爬虫:正则表达式库re
- Mysql搜索不为空的数据时
- CouponView自定义优惠卷布局
- 怎么将java工程转变为web工程
- App渠道统计技术选型参考:openinstall的App安装量统计的优势在哪里
- 代理模式(proxy)c++版本
- java creeper
- uCOS-II中的任务切换-图解多种任务调度时机与问题——转自apollius@格子间
- nginx反向代理服务器安装、基本配置