python学习之正则表达式应用
来源:互联网 发布:淘宝店出售 编辑:程序博客网 时间:2024/05/21 09:40
1.在一段字符中找出tip 或 top
import rest = "top tip taq twp tep"res = r"t[io]p"print re.findall(res,st)
输出:[‘top’, ‘tip’]
2.在一段字符在找出‘t?p’(‘?’表示除了’i’或’o’以外的任意字符)
import rest = "top tip taq twp tep"res = r"t[^io]p"print re.findall(res,st)
输出:[‘twp’, ‘tep’]
3.判断字符串s是否是以hello开头
import res = "hello world,hello boy"r = r"^hello"print re.findall(r,s)
输出为:[‘hello’]
4.判断字符串s是否是以boy开头
import res = "hello world,hello boy"r = r"boy$"print re.findall(r,s)
输出为:[‘boy’]
5.匹配电话010-开头后面跟着八个数字
import res = "010-77189021"r = r"^010-\d{8}$"print re.findall(r,s)
输出为:[‘010-77189021’]
6.a后面至少一个b
import res = "abbbbbbb"s1 = "a"r = r"ab+"print re.findall(r,s)
输出为:
[‘abbbbbbb’]
[]
7.a后面至少零个b
import res = "abbbbbbb"s1 = "a"r = r"ab*"print re.findall(r,s)print re.findall(r,s1)
[‘abbbbbbb’]
[‘a’]
8.a后面有一个或没有b
import res = "abbbbbbb"s1 = "a"r = r"ab?"print re.findall(r,s)print re.findall(r,s1)
输出为:
[‘ab’]
[‘a’]
9.a后面b的个数非贪婪(如果多个之匹配一个)
import res = "abbbbbbb"r = r"ab+?"print re.findall(r,s)
输出:[‘ab’]
闲来无聊,附加一个爬虫。
匹配百度主页的所有汉字:
import reimport urllibimport urllib2def get_html(url): request = urllib2.Request(url) response = urllib2.urlopen(request) html = response.read() return htmldef get_china(url): html = unicode(get_html(url),'utf8') r = ur'[\u4e00-\u9fa5]+' #ur,u表示unicode编码,r表示原始字符没有变化 china = re.findall(r,html) return chinachina = get_china("http://www.baidu.com")for c in china: print c
0 0
- python学习之正则表达式应用
- Python学习之正则表达式
- python学习之 正则表达式
- python学习之正则表达式
- python学习之正则表达式
- python--正则表达式应用
- Python 正则表达式之 补充学习笔记
- python学习之(五)正则表达式
- 学习PYTHON 之 松散正则表达式
- python学习之正则表达式笔记
- Python之学习笔记(正则表达式)
- python之正则表达式的学习
- python学习之2 正则表达式re
- python学习笔记之正则表达式1
- Python基础学习之re正则表达式
- Python学习之路-正则表达式
- python学习笔记之正则表达式
- Python学习笔记之正则表达式基本知识
- poj 3258 River Hopscotch 【二分查找(最大化最小值)】
- Java中的线程技术
- 51nod 1091 线段的重叠 (贪心)
- 你不知道的JavaScript--Item9 call(),apply(),bind()与回调
- AJAX的优缺点
- python学习之正则表达式应用
- 2015-10-17
- VC ON_CONTROL_RANGE多个控件响应一个方法
- NSNumber与NSInteger的区别
- Ubuntu中安装和配置Samba服务
- Codevs P1655 物流运输
- leetcode : 4 Median of Two Sorted Arrays
- ACM学习-综合题-填字游戏
- Reverse Bits