使用MySQL正则表达式 __MySQL必知必会

来源:互联网 发布:淘宝全球购怎么入驻 编辑:程序博客网 时间:2024/06/03 21:49


正则表达式作用是匹配方本,将一个模式(正则表达式)与一个文本串进行比较。
MySQL用WHERE子句对正则表达式提供了初步的支持,允许你指定用正则表达式过滤SELECT检索出的数据。
MySQL仅支持多数正则表达式实现的一个很小的子集。
----------------------
9.2.1  基本字符匹配
REGEXP后所跟的东西作为正则表达式处理。
代码


SELECT prod_name
FROM products
WHERE prod_name REGEXP '1000'
ORDER BY prod_name;


------返回------
+------------------------+
|    prod_name    |
+------------------------+
|  JetPack 1000  |
+------------------------+


 
 
.  表示匹配任意一个字符。
代码


SELECT prod_name
FROM products
WHERE prod_name REGEXP '.000'
ORDER BY prod_name;


------------返回-----------


+-------------------------+
|     prod_name    |
+-------------------------+
|   JetPack 1000  |
|   JetPack 2000  |
+-------------------------+


 
MySQL中的正则表达式匹配不区分大小写。
为区分大小写,可使用BINARY关键字。
如:WHERE prod_name REGEXP BINARY 'JetPack .000'
 
9.2.2  进行OR匹配
为搜索两个串之一(或者这个串,或者为另一个串),使用 | 。
| 作为OR操作符,表示匹配其中之一。可给出两个以上的OR条件。
代码


SELECT prod_name
FROM products
WHERE prod_name REGEXP '1000 | 2000'
ORDER BY prod_name;


------------返回------------


+----------------------+
|  prod_name   |
+----------------------+
| JetPack 1000 |
| JetPack 2000 |
+----------------------+


 
[ ] 匹配任何单一字符。
[123]定义一组字符,意思是匹配1或2或3.
[ ]是另外一种形式的OR语句,[123] Ton  就是  [1 | 2 | 3] Ton 的缩写。
^ 否定一个字符集合,将匹配除指定字符外的任何东西。[^123]将匹配除这些字符外的任何东西。
代码


SELECT prod_name
FROM products
WHERE prod_name REGEXP '[123] Ton'
ORDER BY prod_name;


-------------返回------------


+--------------------+
| prod_name   |
+--------------------+
| 1 ton anvil    |
| 2 ton anvil    |
+--------------------+


 
匹配范围
[0123456789] 或 [0-9] 将匹配数字0到9
[a-z] 匹配任意字母符号
代码


SELECT prod_name
FROM products
WHERE prod_name REGEXP '[1-5] Ton'
ORDER BY prod_name;


----------返回-----------


+-------------------+
|  prod_name |
+-------------------+
|  .5 ton anvil  |
|  1 ton anvil   |
|  2 ton anvil   |
+-------------------+


 
匹配特殊字符
\\  为前导。即转义.正则表达式内具有特殊意义的所有字符都必须以这种方式转义。
\\-  表示查找 -
\\.  表示查找 .
代码


SELECT prod_name
FROM vendors
WHERE vend_name REGEXP '\\.'
ORDER BY vend_name;


-------------返回-------------


+----------------------+
|  vend_name   |
+----------------------+
|  Furball Inc.    |
+----------------------+


 
\\  也用来引用元字符(具有特殊意义的字符)
\\f    换页
\\n    换行
\\r    回车
\\t    制表
\\v    纵向制表
 
匹配字符类
代码


[:a;num:]    任意字母和数字(同 [a-zA-Z0-9])
[:alpha:]     任意字符(同 [a-zA-Z])
[:blank:]     空格和制表(同 [\\t])
[:cntrl:]        ASCII控制字符(ASCII 0到31和127)
[:digit:]       任意数字(同[0-9])
[:graph:]    与["print:] 相同,但不包括空格
[:lower:]      任意小写字线(同 [a-z])
[:print:]        任意可打印字符
[:punct:]      既不在 [:alnum:] 又不在 [:cntrl:] 中的任意字符
[space:]       包括空格在内的任意空白字符(同 [\\f\\n\\t\\r\\v])
[:upper:]     任意大小字母(同 [A-Z])
[:xdigit:]      任意十六进制数字(同 [a-fA-F0-9])


 
匹配多个实例
代码


元字符              说明
*                       0个或多个匹配
+                      1个或多个匹配(等于 {1, })
?                      0个或1个匹配(等于 {0, 1})
{n}                    指定数目的匹配
{n, }                  不少于指定数目的匹配
{n ,m}                匹配数目的范围(m不超过255)


 
以下例子:s后的?使s可选,因为?匹配它前面的任何字符的0次或1次出现。
代码


SELECT prod_name
FROM products
WHERE prod_name REGEXP '\\([0-9] sticks?\\)'
ORDER BY prod_name;


------------返回------------


+-----------------------+
|  prod_name    |
+-----------------------+
|  TNT (1 stick)   |
|  TNT (5 sticks) |
+-----------------------+


 
匹配连在一直的4位数字:WHERE prod_name REGEXP '[[:digit:]]{4}'
 
定位符
^         文本的开始
$        文本的末尾
[[:<:]]  词的开始
[[:>:]]  词的结尾
 
代码


SELECT prod_name
FROM products
WHERE prod_name REGEXP '^[0-9\\.]'
ORDER BY prod_name;


-----------返回----------


+---------------------+
|   prod_name  |
+---------------------+
|  .5 ton anvil   |
|  1 ton anvil    |
|  2 ton anvil    |
+---------------------+


 
^的双重用途:在集合中(用[ ]定义),用它来否定该集合。否则,用来指串的开始和。
LIKE 匹配整个串,而REGEXP匹配子串。
    简单的正则表达式测试  可以在不使用数据库的情况下用SELECT来测试正则表达式。
    REGEXP检查总是返回0(没有匹配)或1(匹配),可以用带文字串的REGEXP来测
    试表达式,并试验它们。相应的语法如下:
        SELECT 'hello' REGEXP '[0-9]'

    这个例子返回0(因为文本hello中没有数字)。

http://www.cnblogs.com/way_testlife/archive/2010/09/17/1829567.html

原创粉丝点击