python提取文章中的中文数字
来源:互联网 发布:局域网屏幕监控软件 编辑:程序博客网 时间:2024/06/05 05:09
新建mytest.txt
添加内容:
或多或少的好好读书电锯惊魂20202 和水电费后是否会时候1212没收到风10.12海大富的是粉红色的和办法的1244525.000会发生的粉红色的合法化好0.01给对方会感受到发给还是干活0001还打飞机大嫁风尚蝴蝶结个房间小电风扇豆腐干很多事123,450,000.000好盛大黑色的十一万八千四百三十二的还好丁世德11万2200海大富会闪烁二十万零三
python代码如下:
# _*_coding:utf-8 _*_import sysimport rereload(sys)sys.setdefaultencoding('utf8')def numberChange(path): f = open(path,'r') s = f.read() for i in ["utf8","gb2312"]: try: data = s.decode(i) break except: pass # 匹配中的 ‘u’不可少 number = re.compile(ur'([一二三四五六七八九零十百千万亿]+|[0-9]+[,]*[0-9]+.[0-9]+)') pattern = re.compile(number) all = pattern.findall(data) for i in all: print '*' print i # 打印的内容 # 20202 # 1212 # 10.12 # 1244525.000 # 0001 # 123, 450, 000 # 十一万八千四百三十二 # 11 # 万2200 # 二十万零三 f.close()if __name__=='__main__': path='./mytest.txt' numberChange(path)
代码运行结果:
*
20202
*
1212
*
10.12
*
1244525.000
*
0001
*
123,450,000
*
十一万八千四百三十二
*
11万2200
*
二十万零三
Process finished with exit code 0
阅读全文
0 0
- python提取文章中的中文数字
- python 提取字符串中的数字
- python 提取字符串中的数字
- python提取字符串中的数字
- python提取文本中的中文
- python提取字符串中的所有数字
- Python中字符串中的数字提取方法
- python-提取一串字符串中的数字
- 提取数字,英文,中文
- 6 MySQL UDF提取字符串中的字符(中文、英文、数字)
- 提取字符串中的数字
- 提取字符串中的数字
- 提取字符串中的数字
- 提取字符串中的数字
- 提取字符串中的数字
- python 中文词频提取
- [SQL Server] 提取数字、提取英文、提取中文
- python提取字符串中数字
- Java正则表达式中量词贪婪型,勉强型,占有型简单描述
- GIT JSON MAVEN DOCKER
- 个人学习记录-无用处
- 论文阅读:How to Construct Deep Recurrent Neural Networks
- 程序的编译链接过程
- python提取文章中的中文数字
- 任学堂说科技:数百万人的噩梦,人工智能将侵蚀银行岗位,从业者该如何自救?
- Linux中的基本网络配置
- vue2.0引用vue-awesome-swiper插件实现左右滑动轮播效果
- Codeforces Round #440 (Div. 2, based on Technocup 2018 Elimination Round 2) 总结
- 任学堂说科技:细思极恐|未来人工智能如何与人类和平相处?
- 树DP [ZJOI2008]骑士
- Excel公式:本年当前周(本周一
- eclipse部署maven web项目到tomcat服务器时,没有将lib、web.xml复制过去的解决办法