程序博客网 > 2017恩智浦智能车算法

Python 基础 —— re：正则表达

来源：互联网发布：2017恩智浦智能车算法编辑：程序博客网时间：2024/05/16 03:03

去除所有的 html 标签

re.compile(r'<[^>]+>').sub('', html)                            # sub：表示 substitute，替换

去除所有的非字母
```
re.sub('[^a-zA-Z]', ' ', text)
```

1. re.search(re, str)：寻找符合正则的子串本身

我们要移除如下字符串中的数字：

>>> raw = 'Toy Story (1995)'

（已知数字仅出现在最右侧，表达电影的年份）

>>> grps = re.search('\((\w+)\)', raw)>>> grps<_sre.SRE_Match object at 0x01A19960>

如果此时未在字符串中找到字符匹配，re.search() 的返回为 NoneType 对象，对 NoneType 对象进行任何操作，显然都是非法的。所以一定要对 re.search() 的返回值做判断：

>>> if grps:...     raw[:grps.start()].strip()...'Toy Story'

3. 切分文本

import rere.compile('\\W*').split(sentences)

（1）\W：非字符
（2）\\W：第一个斜线表示转义；

我们可以再加一些额外的判断逻辑（或叫断言，predicate）以屏蔽那些非单词。

[word.lower() for word in re.compile('\\W*').split(sentences) if len(word) > 2 and len(word) < 20]

4. re.findall 指定长度切分

>> s = 'abcdef'>> re.findall('.{3}', s)['abc', 'def']

当要切分的对象其长度不满足于切片的倍数时：

>> s = 'abcdefgh'>> re.findall('.{3}', s) ['abc', 'def']

将会把末尾的部分舍去；

0 0

2017恩智浦智能车算法

2017恩智浦智能车算法

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子 iwatch3屏幕刮花怎么办 ipad屏幕花了怎么办屏幕划了一下怎么办小米8屏幕划痕怎么办苹果手表死机了怎么办手机屏花了怎么办表把松了怎么办苹果手表掉漆怎么办耳机挂钩坏了怎么办手机丢了iwatch怎么办玩游戏耗电快怎么办笔记本键盘进液怎么办苹果耳机泡水里了怎么办苹果充电太慢怎么办苹果六掉电厉害怎么办 ipad排线松了怎么办 iapd摔坏了怎么办 ipad摔黑屏了怎么办平板显示屏碎了怎么办平板液晶屏坏了怎么办笔记本显示屏不亮怎么办冰箱显示屏不亮怎么办空调显示屏不亮怎么办 ipad花屏重影怎么办 ipad mini 花屏怎么办 ipadair2屏碎了怎么办平板屏幕碎了怎么办 ipad压弯了怎么办苹果浏览器横屏怎么办收到快递少件怎么办乐视手机售后怎么办乐视手机掉到水里怎么办乐视手机关不掉怎么办手机进水耗电快怎么办耳机在水里泡了怎么办电脑主机泡水了怎么办苹果x后屏碎了怎么办乐视手机黑屏怎么办乐视超3x50黑屏怎么办手机屏幕不好使了怎么办 ipadair屏碎了怎么办