python中的正则表达式笔记与总结

来源:互联网 发布:淘宝试用在哪里 编辑:程序博客网 时间:2024/05/18 18:43

    最近在学习python编写爬虫,其中对正则表达式有要求,就学了点正则表达式。本文作为一个总结。。。

    正则表达式regular expression(regex)是一种字符串,由字符和特殊符号组成,描述了字符和字符的某种重复方式,能按某种模式匹配一系列有相似特征的字符串。

    注意点:匹配match指从一个字符串的开始进行部分or全部匹配,搜索search指从字符串的任意位置进行模式的匹配。

     正则表达式使用的字符和特殊字符,见下表:

    即大概有:管道符号(|) 、任意单个字符(.)、字符串的开头or结尾or单词边界开始匹配(^、$、\b、\B)、创建字符类([])、指定范围(-)和否定(^)、闭包操作符(*、+、?、{})实现多次出现或重复匹配(使用的是贪心策略!!)、特殊字符表示和字符集、圆括号(())创建子组。

    正则表达式有多种多样的风格,但正则表达式本身是固定的。

     python中re模块的主要函数:

   

   

    

0 0
原创粉丝点击