Linux命令中使用正则表达式

来源:互联网 发布:阿里云企业网站 编辑:程序博客网 时间:2024/04/28 07:56

在使用grep、awk和sed命令时,需要使用正则表达式。这里说一下正则表达式基本的应用:


^只匹配行首$只匹配行尾*一个单字符后紧跟*,匹配0个或多个此单字符[]匹配[]内字符,可以是一个单字符,也可以是字符序列。可以使用 - 表示[]内字符序列范围,如用[1-5]代替[12345]\用来屏蔽一个元字符的特殊含义。因为有时在shell中一些元字符有特殊含义。\可以使其失去应有含义。.匹配任意单字符pattern\{n\}用来匹配前面pattern出现次数。n为次数pattern\{n,\}含义同上,但次数最少为npattern\{n,m\}含义同上,但pattern出现次数在n与m之间


1.使用句点匹配单字符

句点"."可以匹配任意单字符。例如,如果要匹配一个字符串,以beg开头,中间夹一个任意字符,那么可以表示为beg.n,"."可以匹配字符串头,也可以是中间任意字符。在ls -l命令中,可以匹配一定权限

root@liaozhongmin5 /]# ls -l | grep ...x..x..xdr-xr-xr-x.   2 root root  4096 7月   4 2014 bindr-xr-xr-x.   5 root root  1024 7月   4 2014 bootdrwxr-xr-x.   2 root root  4096 11月 23 2013 cgroupdrwxr-xr-x.  19 root root  3780 3月  10 13:47 devdrwxr-xr-x. 138 root root 12288 3月  10 13:52 etcdrwxr-xr-x.   3 root root  4096 2月  26 20:14 hadoopdrwxr-xr-x.  25 root root  4096 2月  28 18:03 homedrwxr-xr-x.   2 root root  4096 2月  28 17:36 lavimerdr-xr-xr-x.  18 root root 12288 7月  10 2014 libdrwxr-xr-x.   3 root root  4096 3月  10 13:49 media[root@liaozhongmin5 /]# 

2.在行首以^匹配字符串或字符序列

^只允许在一行的开始匹配字符或单词。例如,使用ls -l命令,并匹配目录。

~$ ls -l |grep ^ddrwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bindrwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacsdrwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etcdrwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 infodrwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leimdrwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lispdrwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp
注:d开头表示目录。


3.在行尾以$匹配字符串或字符

可以说$与^相反,它在行尾匹配字符串或字符,$符号放在匹配单词后。假定要匹配以单词sp结尾的所有行,操作为:

~$ ls |grep sp$lispsite-lisp~$


4.使用*匹配字符串中的单字符或其重复序列

使用此特殊字符匹配任意字符或字符串的重复多次表达式。例如:

找e*m(以e开头m结束的字符串)

~$ ls | grep e*memacsleim~$

5.使用反斜杠\屏蔽一个特殊字符的含义

有时需要查找一些字符或字符串,而他们包含了系统指定为特殊字符的一个字符。什么是特殊字符呢?一般意义上讲,下列字符可以认为是特殊字符:

$ . ' " * [] ^ | {} \ + ?

例如:找以.el后缀的文件

~/lisp$ ls | grep \.el$abbrev.elabbrevlist.eladd-log.elalign.elallout.elansi-color.elapropos.elarc-mode.elarray.elautoarg.elautoinsert.elautorevert.elavoid.elbattery.elbindings.elbookmark.elbs.elbuff-menu.elbutton.elcalculator.elcase-table.el

6.使用[]匹配一个范围或集合

使用[]匹配特定字符串或字符串集,可以用逗号将括弧内要匹配的不同字符串分开,但并不强制要求这样做(一些系统提倡在复杂的表达式中使用逗号),这样做可以增加模式的可读性。

使用"-"表示一个字符串范围,表明字符串范围从"-"左边字符开始,到"-"右边字符结束。

假定要匹配任意一个数字,可以使用:

[0123456789]

然而,通过使用"-"符号可以简化操作:

[0-9]

或任意小写字母:

[a-z]

要匹配任意字母,则使用:

[A-Za-z]

表明从A-Z、a-z的字母范围。


如果要匹配任意字母或数字,模式如下:

[A-Za-z0-9]


注意^符号的使用,当直接用在第一个括号里,意指否定或不匹配括号里内容

匹配任一非字母型字符,而

[^a-zA-Z]

匹配任一非数字型字符

[^0-9]


7.使用pattern\{\}匹配模式结果出现的次数

使用*可匹配所有匹配结果任意次,但如果只要指定次数,就应该使用\{\},此模式有三种形式,即:

pattern\{n\}匹配模式出现n次

pattern\{n,\}匹配模式出现最少n次

pattern\{n,m\}匹配模式出现n到m次之间,n,m为0-255中任意整数。

例如格式如下:前4个字符是数字,接下来是xx,最后4个也是数字

操作如下:

[0-9]\{4\}xx[0-9]\{\4}

具体含义如下:

1):匹配数字出现4次

2):后跟代码xx

3):最后是数字出现4次



文章来自:http://www.cnblogs.com/Quincy/archive/2012/03/26/2418485.html


0 0
原创粉丝点击