GAWK(二):将RS、FS设置为连续空格的三种方法
来源:互联网 发布:奥迪a4l矩阵式led大灯 编辑:程序博客网 时间:2024/06/15 23:52
在字符串的分割中,由于信息传递的多样性,导致分析的文本出现多样性,比如将常用的制表符“\t”设置为4个连续的空格,此时如果继续沿用默认的匹配,将会出现多个空白的域。
解决此问题,最好的办法莫过于使用正则表达式,但AWK中并没有标准的空格转义字符,退格符\b(属于控制字符,编码为0000 1000)不等于空格。
1. 使用字符表述
这是最直接的方法,直接用空格键输入即可,共有两种方式,如下:
# 请注意中括号中的空白FS = "[ ]{4,}"# 请注意量词前面的空白FS = " {4,}"
2. 使用八进制表述
基于ASCII编码,可以将空格进行编码转义,如下:
FS = "\040{4,}"
在这种表述方法中,数字一定要有三位,最前面的“0”绝不可以省略。
3. 使用十六进制转义
与八进制类似,只不过计算不一样,且前面的字符为“\x”,如下:
FS = "\x20{4,}"
其他
在正则表达式的使用过程中,我发现FS的赋值一定要使用字符串,而不可直接使用正则表达式匹配,如下:
# 程序将提示语法错误,无法运行 FS = /\x20{4,}/
阅读全文
0 0
- GAWK(二):将RS、FS设置为连续空格的三种方法
- 替换连续空格为一空格的三种方法
- GAWK(一):RS、FS与ORS、OFS等内置变量的用法
- 将字符串中连续的空格转换为一个空格
- 一没考虑单词重复,二没考虑先输入空格,三没考虑后面连续输空格,方法见空格将空格前面的当成一个字符串,字符串比较是否相同,再统计
- 将linux文件中的tab更换为空格的三种方法
- VS2008将原有的tab空格设置为空格符号
- VS2008将原有的tab空格设置为空格符号
- awk 笔记之三 - 输入的处理 FS RS
- 将linux文件中的tab更换为空格的三种方法2010-08-09 15:50:36
- 将连续空格合并为一个空格输出
- 多个连续的空格替换为一个空格的方法
- 使用正则表达式将一个字符串中连续的多个(两个或者两个以上)替换为一个空格
- FS获取KERNEL32基址的三种方法
- FS获取KERNEL32基址的三种方法
- 将连续空格合并
- php将连续回车(换行)、空格正则替换为1个
- 将连续的多个空格用一个空格代替
- java网络编程
- 为什么HashMap 常用String 对象作key
- ubuntu 作为服务器,创建新用户,并设置为管理员权限。
- 程序员毕业五年那些事儿
- QML中展示文件列表的listmodel:FolderListModel
- GAWK(二):将RS、FS设置为连续空格的三种方法
- 处理大并发之四 libevent demo详细分析(对比epoll)
- AlexNet
- [惊险小说]失踪的档案(ED2000.COM).pdf 免费下载
- JSP&Servlet学习笔记(2): 编写与设置Servlet
- 第八篇实训博客
- TabLayout +ViewPager + Fragment : RecyclerView展示网络数据 + webView 显示网页
- hadoop(集群)完全分布式环境搭建
- React中使用富文本编辑器Quill,支持粘贴图片