用正则表达式处理字符串中的分组问题
来源:互联网 发布:市场分析数据来源 编辑:程序博客网 时间:2024/06/05 13:30
碰到'122333<<<<'这种字符串,要将其连贯的部分取出,得出['1', '22', '333', '<<<<']这样的列表,能想到的常规办法,遍历字符串,后一个与前一个逐个比较,这样真的很麻烦!
实际上可以借助itertools模块的groupby()方法来处理:
import itertoolsStr = '122333<<<<'Lst = []for key,group in itertools.groupby(s): Lst.append(list(group))print map(lambda x: ''.join(x), Lst)
上面的处理,还是比较有技巧,也能得到想要的输出结果
['1', '22', '333', '<<<<']但更酷点,更技巧处理方式是用正则表达式来处理:
import reStr = '122333<<<<'Lst = []Pat = re.compile(r'((.)\2*)')Rst = [x[0] for x in re.findall(Pat, Str)]print Rst备注:
1. (.) # .匹配任意字符;(.)做分组,方便后面反向引用
2. \2* # \2对里面括号的反向引用;*代表是0个到多个;
3. ((.)\2*) # 连起来就是任意一个或多个字符组成的分组;
4. (.)\1* # 这种方式则可以取出唯一的值['1', '2', '3', '<'];同样非常方便
阅读全文
1 0
- 用正则表达式处理字符串中的分组问题
- 利用正则表达式将字符串分组处理
- 正则表达式在字符串处理中的应用
- 正则表达式在字符串处理中的应用
- 字符串处理:ABAP中的正则表达式
- 正则表达式中的分组断言
- 正则表达式处理字符串
- 正则表达式处理字符串
- Java 正则表达式 分组 解析 字符串
- Java正则表达式分组获取字符串
- 字符串中的正则表达式
- python正则表达式中的分组 group
- 正则表达式中的分组的应用
- python正则表达式中的分组 group
- java中正则表达式中的非字符串处理
- Shell中的正则表达式及字符串处理汇总:
- 关于正则表达式分组的一个问题
- 用正则表达式选出字符串中的数字
- 学习日记3
- java程序初始化的顺序
- Matlab学习笔记
- SQL Server通过外部程序集注册正则表达式函数(CLR函数)
- 华为OJ——矩阵乘法
- 用正则表达式处理字符串中的分组问题
- 使用spi协议,接收来自slave的数据之前写0xff的原因
- ORB特征提取
- 【python】集合
- 深度工作
- mySQL简介
- 训练总结 8.2
- django中 出现(urls.W005) URL namespace 'admin' isn't unique.
- LSTM预测时间序列