秘籍总结:玩转python里的字符串上篇

来源:互联网 发布:贵州广电网络节目表 编辑:程序博客网 时间:2024/06/08 01:06

tips

re 别名替换

text = re.findall('(<div class="single-text".*?)<div class="sg-tag"', res.text, re.S)[0]text = re.sub(r'<img src="http:/(.*?)" alt="(.*?)">', '<a href="D:/liudahtml\g<1>.jpg" target="_blank"><img src="D:/liudahtml\g<1>.jpg" alt="\g<2>"></a>', text)

找最长的单词

这里写图片描述

找单词的长度是5或6

普通的列表推导式 map filter

列出首字母大写的单词

[w for w in text if w.istitle()][w for w in text if re.search(r'^[A-Z]',w)]

使用最频繁的单词

from collections import CounterCounter(text).most_common(2)

字符串的分割

text = 'liuda|liuda;;;;;;;liuda\tliuda're.split(r'[|\t;]+', text)['liuda', 'liuda', 'liuda', 'liuda']

字符串的拼接

lists = ['my', 'name', 'is', 'liuda']' '.join(lists)Out[38]: 'my name is liuda
lists = ['i', 'have', 133, 'apples']' '.join(map(str, lists))'i have 133 apples'

字符串的删除

删除字符串中间不符合条件的字符

s = '-- -hello*()python***'re.sub(r'[\-()*\s]+','', s)Out[46]: 'hellopython'
原创粉丝点击