【Linux学习笔记九】Shell编程-正则表达式

来源：互联网发布：中核原子能公司知乎编辑：程序博客网时间：2024/05/01 08:00

【注】文章中的所有截图均为centos下实验结果，亲测命令正确=￣ω￣=

【参考资料】《Linux从入门到精通（第2版）》刘忆智等编著

1、定义：模式，对正在查找的文本的描述

POSIX库和PCRE均可以用于正则表达式编程。前者是Linux自带库，后者为Perl的库，功能更强大一些，也更难掌握。

2、字符集和单词

首先安装一下words：sudo yum install words 存在于 /usr/share/dict/words

“.”用于匹配换行符以外的任意一个字符。

.at ##匹配诸如cat、sat、bat、#at、~at的字符串

[a-z]at ##限定at之前只能是小写字符

“[ ]”用于指定一个字符集，但只匹配其中的一个字符。

[abc] ##只能匹配a或b或c中的一个字符

“-”用于描述一个范围。

[a-zA-Z] ##能够匹配所有的英文字符

[0-9] ##匹配所有的一位数字

$ egrep '[a-z]at' /usr/share/dict/words ##查找具有“一个字符+at”形式的单词

$ egrep '\<[a-z]at\>' /usr/share/dict/words ##为了让其可以严格匹配一个单词，需要加上“\<”和“\>”

但是仍会出现有多余字符的字符串被匹配（如上图），这是由于正则表达式中“单词”指的是两侧由非单词字符分割的字符串。

【转载请注明文章出处：http://blog.csdn.net/iamthezbl/article/details/51346603】

3、字符类

$ egrep "^[[:upper:]]t$" words ##找出所有以大写字母开头（^）和以t结尾（$）的行

[[:upper:]]就是一个字符类，表示所有的大写字母，等价于[A-Z]。下边列出完整的字符串类

类匹配字符 [[:alnum:]]
文字、数字字符 [[:alpha:]]
字母字符 [[:lower:]]
小写字母 [[:upper:]]
大写字母 [[:digit:]]
小数 [[:xdigit:]]
十六进制数字 [[:punct:]]
标点符号 [[:blank:]]
制表符和空格 [[:space:]]
空格 [[:cntrl:]]
所有控制符 [[:print:]]
所有可打印的字符 [[:graph:]]
除空格外所有可打印的字符

4、位置匹配

字符“^”和“$”分别用于匹配行首和行尾。“^$”可以匹配空行，“$^”不会报错，但不会输出任何东西。

^a[a-z]t$ ##a开头，t结尾，中间含有一个小写字母的行。

^[0-9] ##以数字开头的行