python爬虫之正则表达式

来源:互联网 发布:ubuntu 阿里源 gpg 编辑:程序博客网 时间:2024/05/19 03:17

search函数

import re                   #re库pattern=re.compile(r'worlda')         #compile编译生成可操作对象m=re.search(pattern,'hello world!')   #search的结果有一些属性,其                  #中group()返回[**如果查找成功,则返回匹配的段落**]。if m:    print(m.group())

split函数

import repattern=re.compile(r'\d+') #\d+匹配数字print(re.split(pattern,'one1two2three3four4')) # 返回被分割几个字母段,包括空段=====输出['one', 'two', 'three', 'four', '']

findall函数

import repattern = re.compile(r'\d+')print(re.findall(pattern,'one1two2three3four4'))#找出所有的数字

finditer函数

import repattern=re.compile(r'\d+')for m in re.finditer(pattern,'one1two2three3four4'):#返回数字迭代器    print (m.group())
原创粉丝点击