Notepad++ 正则表达式 中文处理

来源:互联网 发布:mask rcnn tensorflow 编辑:程序博客网 时间:2024/06/05 02:48
最近总是回忆。

上个月大脑时不时闪回到初一初二,傻傻的赖在别人家看电视剧,沉浸在光怪陆离的武侠世界里。

忽然想到,有一部武侠剧我只看过几集,虽然现如今留下的回忆不多,但对女主角却有很深的印象。一时间心血来潮,上网搜索起来。没想到,只用了5分钟,就找到了,飞花逐月。

看了简介,惊讶地发现,里面的男女主角都是大名鼎鼎的人物:黄元申、苗可秀。其原作者也是香港的名人卧龙生。这竟然是一部被严重低估的大作!

匆匆下载了txt小说,看了一周,不觉惊叹小说的情节之奇。

和同事聊天,脑中灵光一闪:再试试古龙的小说吧。

于是今天找到了txt版的《多情剑客无情剑》。

据说这是古龙的巅峰之作。希望不要再让我失望。

我把txt粘到WPS里,想导出成PDF到Kindle。忽然发现txt版有很多多余的回车(换行)。如下所示:


最终用正则表达式替换掉了所有的回车。


Find what: \r\n([^ ]{2})

Replace with: \1

有的换行是没问题的,要保留。有问题的是第二行开头有中文字的(非空格)。{2}这个尾缀很重要,因为中文都是双字符表示。不写2的话会出现乱码。

原创粉丝点击