关于SQL中查找字符串的总结 PATINDEX CHARINDEX 返回字符串中第N次出现指定字符串位置

来源:互联网 发布:class属性php 编辑:程序博客网 时间:2024/05/18 01:27
假如你寫過很多程序,你可能偶爾會碰到要確定字符或字符竄串否包含在一段文字中,在這篇文章中,我將討論使用CHARINDEX和PATINDEX函數來搜索文字列和字符串。我將告訴你這兩個函數是如何運轉的,解釋他們的區別。同時提供一些例子,通過這些例子,你可以可以考慮使用這兩個函數來解決很多不同的字符搜索的問題。
CHARINDEX和PATINDEX函數常常用來在一段字符中搜索字符或者字符串。如果被搜索的字符中包含有要搜索的字符,那麼這兩個函數返回一個非零的整數,這個整數是要搜索的字符在被搜索的字符中的開始位數。PATINDEX函數支持使用通配符來進行搜索,然而CHARINDEX不支持通佩符。接下來,我們逐個分析這兩個函數。

如何使用CHARINDEX函數

CHARINDEX函數返回字符或者字符串在另一個字符串中的起始位置。CHARINDEX函數調用方法如下:

SQL代碼
  1. CHARINDEX ( expression1 , expression2 [ , start_location ] )

Expression1是要到expression2中尋找的字符中,start_location是CHARINDEX函數開始在expression2中找expression1的位置。

CHARINDEX函數返回一個整數,返回的整數是要找的字符串在被找的字符串中的位置。假如CHARINDEX沒有找到要找的字符串,那麼函數整數「0」。讓我們看看下面的函數命令執行的結果:

SQL代碼
  1. CHARINDEX('SQL','Microsoft SQL Server')

這個函數命令將返回在「Microsoft SQL Server」中「SQL」的起始位置,在這個例子中,CHARINDEX函數將返回「S」在「Microsoft SQL Server」中的位置11。
接下來,我們看這個CHARINDEX命令:

SQL代碼
  1. CHARINDEX('7.0','Microsoft SQL Server 2000')

在這個例子中,CHARINDEX返回零,因為字符串「7.0」 不能在「Microsoft SQL Server」中被找到。接下來通過兩個例子來看看如何使用CHARINDEX函數來解決實際的T-SQL問題。

第一個例子,假設你要顯示Northwind資料庫Customer表前5行聯繫人列的Last Name。這是前5行資料

XML/HTML代碼
  1. ContactName
  2. ------------------------------
  3. Maria Anders
  4. Ana Trujillo
  5. Antonio Moreno
  6. Thomas Hardy
  7. Christina Berglund

你可以看到,CustomName包含客戶的First Name和Last Name,它們之間被一個空格隔開。我用CHARINDX函數確定兩個名字中間空格的位置。通過這個方法,我們可以分析ContactName列的空格位置,這樣我們可以只顯示這個列的last name部分。這是顯示Northwind的Customer表前5行last name的記錄!

SQL代碼
  1. select top 5substring(ContactName,charindex(' ',ContactName)+1 ,
  2. len(ContactName)) as [LastName]from Northwind.dbo.customers

下面是這個命令輸出的結果。

XML/HTML代碼
  1. Last Name
  2. ------------------------------
  3. Anders
  4. Trujillo
  5. Moreno
  6. Hardy
  7. Berglund

CHARINDEX函數找到First Name和Last Name之間的空格,所以SUBSTRING函數可以分開ContactName列,這樣就只有Last Name被選出。我在CHARINDEX函數返回的整數上加1,這樣Last Name不是從空格開始。

在第二個例子中,即如說你要計算記錄中,某一個字段包含特定字符的所有記錄數。CHARINDEX函數可以方便的解決你的問題。計算Northwind.dbo.Customer表中Addresses字段中包含單詞Road或者它的縮寫Rd的記錄數,選擇語句類似這樣:

SQL代碼
  1. Select count(*)from Northwind.dbo.Customers
  2. Where CHARINDEX('Rd',Address) > 0or CHARINDEX('Road',Address)> 1

如何使用PATINDEX函數

PATINDEX函數返回字符或者字符串在另一個字符串或者表達式中的起始位置,PATINDEX函數支持搜索字符串中使用通配符,這使PATINDEX函數對於變化的搜索字符串很有價值。PATINDEX函數的命令如下:

SQL代碼
  1. PATINDEX ( '%pattern%' , expression )

Pattern是你要搜索的字符串,expression是被搜索的字符串。一般情況下expression是一個表中的一個字段,pattern的前後需要用「%」標記,除非你搜索的字符串在被收縮的字符串的最前面或者最後面。

和CHARINDEX函數一樣,PATINDEX函數返回搜索字符串在被搜索字符串中的起始位置。假如有這樣一個PATINDEX函數:

SQL代碼
  1. PATINDEX('%BC%','ABCD')

這個PATINDEX函數返回的結果是2,這和CHARINDEX函數一樣。這裡的%標記告訴PATINDEX函數去找字符串「BC」,不管被搜索的字符串中在「BC」的前後有多少字符!
假如你想知道被搜索字符串是否由特定的字符串開始,你可以省去前面的%標記。PATINDED函數就要這樣寫:

SQL代碼
  1. PATINDEX('AB%','ABCD')

這個命令執行的結果返回1,表示搜索的字符串「AB」在被搜索的字符串中「ABCD」被找到。

使用通配符可以編輯比我以上舉得簡單例子複雜得多的搜索字符串。假如說你要確定一個字符串是否包含字母A和Z,還有任何數字,這個PARINDEX函數命令可能像這樣:

SQL代碼
  1. PATINDEX('%[A,Z,0-9]%[A,Z,0-9]%[A,Z,0-9]%','XYZABC123')

注意在上面這個例子中的搜索字符部分使用了很多的通陪符。察看SQL Server聯機叢書可以獲得更多關於通佩符的資料。接下來,我們用兩個例子來看PATINDEX和Select怎麼聯合起來使用。

假設你想要找出Northwind.dbo.Categories表中Description字段中是包含單詞「Bread」或「bread」的所有記錄,那麼選擇語句就可能是這樣:

SQL代碼
  1. Select Description from Northwind.dbo.Categories
  2. Where patindex('%[b,B]read%',description) > 0

這裡我用通配符來確定大寫和小寫的「b」。我在Notthwind資料庫中執行這個腳本後,得到下面的結果:

XML/HTML代碼
  1. Description
  2. --------------------------------------------------------
  3. Desserts, candies, and sweet breads
  4. Breads, crackers, pasta, and cereal

這是再用另外一個額外的通配符來查找一些記錄的例子。這個例子是如何選出上面的查詢結果中,Description字段的第二子字母不是「e」的紀錄。

SQL代碼
  1. select Description from Northwind.dbo.Categories
  2. where patindex('%[b,B]read%',description) > 0
  3. and patindex('_[^e]%',description) = 1

通過在條件語句中增加一個使用^通配符的PATINDEX函數,我們可以過濾掉「Dessert, candies, and sweet breads」這條記錄。上面的查詢結果只有一條記錄。

XML/HTML代碼
  1. Description
  2. --------------------------------------------------------
  3. Breads, crackers, pasta, and cereal

總結

你現在可以發現CHARINDEX和PATINDEX搜索字符串時的區別了吧。PATINDEX函數支持使用通配符,可以用在很多有變化的查找中。而CHARINDEX不可以。根據你自己不同的情況,這兩個函數對你在SQL Server中的字符串的搜索、控制、分析很有幫助。


****************************************************

charindex代替like並非"更快更全面"

首先:先明確掉全面這個問題,想like百分號很簡單,幫助文檔裡面就有

ms-help://MS.SQLCC.v9/MS.SQLSVR.v9.zh-CHS/tsqlref9/html/581fb289-29f9-412b-869c-18d33a9e93d5.htm

轉義百分號類似下面方法:

SQL代碼
  1. select * from
  2. (select 'a%b'as sunionselect'ab' )t
  3. where s like'%\%%'escape'\' ;

反而,like可以實現比charindex更複雜的通配功能,比如partindex函數才支持的方括號

SQL代碼
  1. select * from (select'amm_99'as sunionselect'happyflystone' ) t
  2. where s like'%[0-9]%'

然後:說一下是否更快,這個需要有測試資料,不是我相信快就快的,sql優化結果誰都無法預料。我在windows2008+sqlserver2005中的測試結果是沒有索引一樣快,有索引like快。

特別強調一下雖然是%%的like,索引還是起作用的。

測試資料如下:


SQL代碼
  1. use tempdb
  2. go
  3. if (object_id ('t_test' )> 0 )droptable t_test
  4. go
  5. create table t_test (f1varchar (100 ), f2varchar (100 ), f3varchar (100 ))
  6. go
  7. insert into t_testselect newid (), newid (), newid ()
  8. go 1000
  9. create index i_teston t_test (f1 )
  10. go

我們看兩組sql語句的查詢計劃

第一組是:

SQL代碼
  1. select * from t_testwhere f1like'%abc%'
  2. select * from t_testwhere charindex ('abc' , f1 )> 0

結果如下:

很明显是like因为有索引扫描(rid是行标志符)而速度快于charindex,这里我们需要理解表扫描,索引扫描和索引查找的区别。为了说明这个问题,我们再看一下 like 'abc%'和charindex('abc',f1)=1的区别。

如果你測試一下,就會知道,charindex('abc',f1)=1和charindex('abc',f1)>0的效率是一樣的。這樣我們就能看出來,索引查找要比索引掃瞄快,索引掃瞄要比表掃瞄快。大概解釋一下我個人的理解,索引的存儲方式是一個特定資料結構的樹,查找可以被優化,不必遍歷整個樹的所有節點所以最快,而索引掃瞄需要遍歷所有樹的節點所以稍慢但仍然要比表掃瞄快。
 
 
 
 

SUBSTRING
返回字符、binary、text 或 image 表达式的一部分。有关可与该函数一起使用的有效 Microsoft® SQL Server™ 数据类型的更多信息,请参见数据类型。

语法
SUBSTRING ( expression , start , length )

参数
expression

是字符串、二进制字符串、text、image、列或包含列的表达式。不要使用包含聚合函数的表达式。

start

是一个整数,指定子串的开始位置。

length

是一个整数,指定子串的长度(要返回的字符数或字节数)。

substring()
——任意位置取子串

left()
right()
——左右两端取子串

ltrim()
rtrim()
——截断空格,没有trim()。

charindex()
patindex()
——查子串在母串中的位置,没有返回0。区别:patindex支持通配符,charindex不支持。

函数功效:
字符串截取函数,只限单字节字符使用(对于中文的截取时遇上奇数长度是会出现乱码,需另行处理),本函数可截取字符串指定范围内的字符。

应用范围:
标题、内容截取

函数格式:
string substr ( string string, int start [, int length])
参数1:处理字符串
参数2:截取的起始位置(第一个字符是从0开始)
参数3:截取的字符数量
substr()更多介绍可在PHP官方手册中查询(字符串处理函数库)

举例:
substr("ABCDEFG", 0); //返回:ABCDEFG,截取所有字符
substr("ABCDEFG", 2); //返回:CDEFG,截取从C开始之后所有字符
substr("ABCDEFG", 0, 3); //返回:ABC,截取从A开始3个字符
substr("ABCDEFG", 0, 100); //返回:ABCDEFG,100虽然超出预处理的字符串最长度,但不会影响返回结果,系统按预处理字符串最大数量返回。
substr("ABCDEFG", 0, -3); //返回:EFG,注意参数-3,为负值时表示从尾部开始算起,字符串排列位置不变

例子:


1.截取已知长度的函数


A.截取从字符串左边开始N个字符

Declare @S1 varchar(100)
Select @S1='http://www.163.com'
Select Left(@S1,4)
------------------------------------
显示结果: http

B.截取从字符串右边开始N个字符(例如取字符www.163.com)

Declare @S1 varchar(100)
Select @S1='http://www.163.com'
Select right(@S1,11)
------------------------------------
显示结果:
www.163.com

C.截取字符串中任意位置及长度(例如取字符www)

Declare @S1 varchar(100)
Select @S1='http://www.163.com'
Select SUBSTRING(@S1,8,3)
------------------------------------
显示结果:
www.163.com
以上例子皆是已知截取位置及长度,下面介绍未知位置的例子

2.截取未知位置的函数


A.截取指定字符串后的字符串(例如截取http://后面的字符串)

方法一:

Declare @S1 varchar(100)
Select @S1='http://www.163.com'
Select Substring(@S1,CHARINDEX('www',@S1)+1,Len(@S1))
/*此处也可以这样写:Select Substring(@S1,CHARINDEX('//',@S1)+2,Len(@S1))*/

------------------------------------
显示结果:
www.163.com


需要注意:CHARINDEX函数搜索字符串时,不区分大小写,因此CHARINDEX('www',@S1)也可以写成CHARINDEX('WWW',@S1)

方法二:(与方法一类似)

Declare @S1 varchar(100)
Select @S1='http://www.163.com'
Select Substring(@S1,PATINDEX('%www%',@S1)+1,Len(@S1))
--此处也可以这样写:Select Substring(@S1,PATINDEX('%//%',@S1)+2,Len(@S1))
------------------------------------
显示结果:
www.163.com

函数PATINDEX与CHARINDEX区别在于:前者可以参数一些参数,增加查询的功能

方法三:

Declare @S1 varchar(100)
Select @S1='http://www.163.com'
Select REPLACE(@S1,'http://','')
------------------------------------
显示结果:
www.163.com

利用字符替换函数REPLACE,将除需要显示字符串外的字符替换为空

方法四:

Declare @S1 varchar(100)
Select @S1='http://www.163.com'
Select STUFF(@S1,CHARINDEX('http://',@S1),Len('http://'),'')
------------------------------------
显示结果:
www.163.com
函数STUFF与REPLACE区别在于:前者可以指定替换范围,而后者则是全部范围内替换

B.截取指定字符后的字符串(例如截取C:\Windows\test.txt中文件名)
与A不同的是,当搜索对象不是一个时,利用上面的方法只能搜索到第一个位置

方法一:

Declare @S1 varchar(100)
Select @S1='C:\Windows\test.txt'
select right(@S1,charindex('\',REVERSE(@S1))-1)
-------------------------------------
显示结果: text.txt


利用函数REVERSE获取需要截取的字符串长度

substr()

例子:

private void DDL_AreaBind()
{
conn = new SqlConnection(ConfigurationManager.ConnectionStrings["strcon"].ConnectionString);
string str = "0000";
cmd = new SqlCommand("select AreaID,Name=ltrim(Name) from Area where right(AreaID,4) ='" + str + "'", conn);
SqlDataAdapter sda = new SqlDataAdapter(cmd);
sda.Fill(ds, "area");
this.ddl_area.DataSource = ds.Tables["area"].DefaultView;
this.ddl_area.DataTextField = "Name";
this.ddl_area.DataValueField = "AreaID";
this.ddl_area.DataBind();


cmd = new SqlCommand("select * from Area ", conn);
cmd.CommandType = CommandType.Text;
SqlDataAdapter adapter = new SqlDataAdapter(cmd);
adapter.Fill(ds, "city");
this.ddl_city.DataSource = ds.Tables["city"].DefaultView;
this.ddl_city.DataTextField = "Name";
this.ddl_city.DataValueField = "AreaID";
this.ddl_city.DataBind();
}

protected void ddl_area_SelectedIndexChanged(object sender, EventArgs e)
{
conn = new SqlConnection(ConfigurationManager.ConnectionStrings["strcon"].ConnectionString);
this.ddl_city.Enabled = true;
string str1="0000";
cmd = new SqlCommand("select AreaID,Name from Area where substring(AreaID,1,2)='" + this.ddl_area.SelectedValue.Substring(0,2) + "' AND substring(AreaID,3,4) <> '0000' AND substring(AreaID,5,2)='00' ", conn);
cmd.CommandType = CommandType.Text;
SqlDataAdapter adapter = new SqlDataAdapter(cmd);
DataSet ds = new DataSet();
adapter.Fill(ds, "city");
this.ddl_city.DataSource = ds.Tables["city"].DefaultView;
this.ddl_city.DataTextField = "Name";
this.ddl_city.DataValueField = "AreaID";
this.ddl_city.DataBind();
}

PS:

最近项目中用到比较少见的SQL语句,分享一下:

查询祖先节点
select * from 目录表_数据库 where ID<>-1 and datatype<>1 and datatype<>2 connect by prior FATHERID=ID start with ID=28 order by 目录级别,ID

查询子孙节点:
select * from 目录表_数据库 where ID<>-1 and datatype<>1 and datatype<>2 connect by prior ID=FATHERID start with ID=28 order by 目录级别,ID

 
最后贴一段如何返回字符串中第N次出现指定字符串位置的函数:
create function fn_find(@find varchar(8000), @str varchar(8000), @n smallint)    returns intasbegin    if @n < 1 return (0)    declare @start smallint, @count smallint, @index smallint, @len smallint    set @index = charindex(@find, @str)    if @index = 0 return (0)    else select @count = 1, @len = len(@find)    while @index > 0 and @count < @n        begin            set @start = @index + @len            select @index = charindex(@find, @str, @start), @count = @count + 1        end    if @count < @n set @index = 0    return (@index)endgodeclare @str varchar(100)set @str='A,B,C,D,A,B,C,D,C,D,B,A,C,E'select dbo.fn_find('A',@str,1) as one, dbo.fn_find('A',@str,2) as two, dbo.fn_find('A',@str,3) as three, dbo.fn_find('A',@str,4) as four/*one         two         three       four        ----------- ----------- ----------- ----------- 1           9           23          0*/


 
 
原创粉丝点击