perl正则表达式中文问题
来源:互联网 发布:李红涛 浙江大学知乎 编辑:程序博客网 时间:2024/05/16 04:11
在使用perl从地址中提取街道的时候遇到了个很诡异的问题
同样一个地址,连续进行两次匹配出来的结果居然不一样
一次是正常的,一次是乱码,搞了半天没弄明白是怎么回事
看来perl的中文处理能力还是有待加强
后来在进行正则匹配之前尝试用了use encoding "gbk";
还算运气不错,居然搞定了
use encoding "gbk";
$address=~/^(.*(市|区))?(.*?(街|路|道)).*?$/s;
no encoding;
后面那个no encoding也别忘记了,否则本来能跑的代码可能就因为加了
一个use encoding "gbk"; 而变的错误满天飞了
补充:后来发现又有问题了:(,看来用这个方法也不行,哎,状态真差
再次补充:解决方法用Encode模块的encode和decode方法进行编码和转码,先将正则表达式和需要匹配的字符串都从gbk转成utf8编码,然后进行匹配,匹配出来的结果再转成gbk返回(此方案来源于perl首席专家,在此向他表示感谢)
来源:http://www.bfor.cn/fish/archive/138523.aspx
- perl正则表达式中文问题
- Perl正则表达式讲解
- Perl正则表达式
- Perl 正则表达式
- perl 正则表达式
- Perl 中的正则表达式
- Perl 中的正则表达式
- Perl中的正则表达式
- perl正则表达式
- Perl中的正则表达式
- Perl 中的正则表达式
- Perl 中的正则表达式
- perl中的正则表达式
- perl 正则表达式
- Perl中的正则表达式
- perl 正则表达式
- Perl正则表达式
- Perl正则表达式初步
- 通过重写Adapter实现多选的ListView
- http协议头文件的控制信息
- [Darktable]dt源码分析(未完)
- 有a,b两个已按学号升序排序的链表,每个链表中的结点包括学号、成绩。要求把两个链表合并,仍按学号升序排列。
- rmn190: good articale about hibernate source code (Total 27)
- perl正则表达式中文问题
- 职场十大潜规则
- 40条PHP代码的优化技巧
- war3联机对战原理以及T人挂原理简述
- COM(VB/VBA/Script)利用类型化契约的服务标记调用WCF服务的方式
- OMAPL138的timer
- 数据库学习
- joeytang9118: Hibernate源码研究碎得整理
- C的xml编程-libxml2