iOS使用正则表达式

来源:互联网 发布:手机麦克风软件 编辑:程序博客网 时间:2024/04/30 00:32
1,官方的predicate
2, 使用RegexKitLite,然后可以直接对字符串使用:
NSString *email = @”kkk@aaa.com”;
[email isMatchedByRegex:@"\\b([a-zA-Z0-9%_.+\\-]+)@([a-zA-Z0-9.\\-]+?\\.[a-zA-Z]{2,6})\\b”];
返回YES,证明是email格式,需要注意的是RegexKitLite用到的正则表达式和wiki上的略有区别。

searchString = @”http://www.example.com:8080/index.html”;
regexString = @”\\bhttps?://[a-zA-Z0-9\\-.]+(?::(\\d+))?(?:(?:/[a-zA-Z0-9\\-._?,'+\\&%$=~*!():@\\\\]*)+)?”;
NSInteger portInteger = [searchString stringByMatching:regexString capture:1L] integerValue];

NSLog(@”portInteger: ‘%ld’”, (long)portInteger);



1.去RegexKitLite下载类库,解压出来会有一个例子包及2个文件,其实用到的就这2个文件,添加到工程中。 备用地址:
http://www.cocoachina.com/bbs/job.php?action-download-pid-135286-tid-18111-aid-11143.html - Lv

2.工程中添加libicucore.dylib frameworks。

3.现在所有的nsstring对象就可以调用RegexKitLite中的方法了。

NSString *email = @”kkk@aaa.com”;

[email isMatchedByRegex:@"\\b([a-zA-Z0-9%_.+\\-]+)@([a-zA-Z0-9.\\-]+?\\.[a-zA-Z]{2,6})\\b”];

返回YES,证明是email格式,需要注意的是RegexKitLite用到的正则表达式和wiki上的略有区别。

searchString = @”http://www.example.com:8080/index.html”;

regexString = @”\\bhttps?://[a-zA-Z0-9\\-.]+(?::(\\d+))?(?:(?:/[a-zA-Z0-9\\-._?,'+\\&%$=~*!():@\\\\]*)+)?”;

NSInteger portInteger = [[searchString stringByMatching:regexString capture:1L] integerValue];

NSLog(@”portInteger: ‘%ld’”, (long)portInteger); 
// 2008-10-15 08:52:52.500 host_port[8021:807] portInteger: ‘8080′
取string中http的例子。


常用正则表达式:

  匹配双字节字符(包括汉字在内):[^x00-xff] 

  评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 
  匹配空白行的正则表达式:ns*r 
  评注:可以用来删除空白行 
  匹配HTML标记的正则表达式:<(S*?)[^>]*>.*?|<.*? /> 
  评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力 
  匹配首尾空白字符的正则表达式:^s*|s*$ 
  评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式 
  匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 
  评注:表单验证时很实用 
  匹配网址URL的正则表达式:[a-zA-z]+://[^s]* 
  评注:网上流传的版本功能很有限,上面这个基本可以满足需求 
  匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 
  评注:表单验证时很实用 
  匹配国内电话号码:d{3}-d{8}|d{4}-d{7} 
  评注:匹配形式如 0511-4405222 或 021-87888822 
  匹配腾讯QQ号:[1-9][0-9]{4,} 
  评注:腾讯QQ号从10000开始 
  匹配中国邮政编码:[1-9]d{5}(?!d) 
  评注:中国邮政编码为6位数字 
  匹配身份证:d{15}|d{18} 
  评注:中国的身份证为15位或18位 
  匹配ip地址:d+.d+.d+.d+ 
  评注:提取ip地址时有用 
  匹配特定数字: 
  ^[1-9]d*$    //匹配正整数 
  ^-[1-9]d*$   //匹配负整数 
  ^-?[1-9]d*$   //匹配整数 
  ^[1-9]d*|0$  //匹配非负整数(正整数 + 0)
  ^-[1-9]d*|0$   //匹配非正整数(负整数 + 0) 
  ^[1-9]d*.d*|0.d*[1-9]d*$   //匹配正浮点数 
  ^-([1-9]d*.d*|0.d*[1-9]d*)$  //匹配负浮点数 
  ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$  //匹配浮点数 
  ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$   //匹配非负浮点数(正浮点数 + 0) 
  ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$  //匹配非正浮点数(负浮点数 + 0) 
  评注:处理大量数据时有用,具体应用时注意修正 
  匹配特定字符串: 
  ^[A-Za-z]+$  //匹配由26个英文字母组成的字符串 
  ^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串 
  ^[a-z]+$  //匹配由26个英文字母的小写组成的字符串 
  ^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串 
  ^w+$  //匹配由数字、26个英文字母或者下划线组成的字符串 
  在使用RegularExpressionValidator验证控件时的验证功能及其验证表达式介绍如下: 
  只能输入数字:“^[0-9]*$” 
  只能输入n位的数字:“^d{n}$” 
  只能输入至少n位数字:“^d{n,}$” 
  只能输入m-n位的数字:“^d{m,n}$” 
  只能输入零和非零开头的数字:“^(0|[1-9][0-9]*)$” 
  只能输入有两位小数的正实数:“^[0-9]+(.[0-9]{2})?$” 
  只能输入有1-3位小数的正实数:“^[0-9]+(.[0-9]{1,3})?$” 
  只能输入非零的正整数:“^+?[1-9][0-9]*$” 
  只能输入非零的负整数:“^-[1-9][0-9]*$” 
  只能输入长度为3的字符:“^.{3}$” 
  只能输入由26个英文字母组成的字符串:“^[A-Za-z]+$” 
  只能输入由26个大写英文字母组成的字符串:“^[A-Z]+$” 
  只能输入由26个小写英文字母组成的字符串:“^[a-z]+$” 
  只能输入由数字和26个英文字母组成的字符串:“^[A-Za-z0-9]+$” 
  只能输入由数字、26个英文字母或者下划线组成的字符串:“^w+$” 
  验证用户密码:“^[a-zA-Z]w{5,17}$”正确格式为:以字母开头,长度在6-18之间,
  只能包含字符、数字和下划线。 
  验证是否含有^%&',;=?$"等字符:“[^%&',;=?$x22]+” 
  只能输入汉字:“^[u4e00-u9fa5],{0,}$” 
  验证Email地址:“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$” 
  验证InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$” 
  验证电话号码:“^((d{3,4})|d{3,4}-)?d{7,8}$” 
  正确格式为:“XXXX-XXXXXXX”,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”,
  “XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。 
  验证身份证号(15位或18位数字):“^d{15}|d{}18$” 
  验证一年的12个月:“^(0?[1-9]|1[0-2])$”正确格式为:“01”-“09”和“1”“12” 
  验证一个月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$” 
  正确格式为:“01”“09”和“1”“31”。 
  匹配中文字符的正则表达式: [u4e00-u9fa5] 
  匹配双字节字符(包括汉字在内):[^x00-xff] 
  匹配空行的正则表达式:n[s| ]*r 
  匹配HTML标记的正则表达式:/<(.*)>.*|<(.*) />/ 
  匹配首尾空格的正则表达式:(^s*)|(s*$) 
  匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 
  匹配网址URL的正则表达式:[url=http://%28[w-]+.%29+[w-]+%28/[w]http://([w-]+.)+[w-]+(/[w[/url]- ./?%&=]*)?



基本使用的例子(更多信息参看 官方文档  
1. 

  1. NSString *searchString = @ "This is neat." ;  
  2. NSString *regexString  = @"(//w+)//s+(//w+)//s+(//w+)" ;  
  3. NSRange   matchedRange = NSMakeRange(NSNotFound, 0UL);  
  4. NSError  *error        = NULL;  
  5. matchedRange = [searchString rangeOfRegex:regexString options:RKLNoOptions inRange:searchRange capture:2L error:&error];  
  6. NSLog(@"matchedRange: %@" , NSStringFromRange(matchedRange));  
  7. // 2008-03-18 03:51:16.530 test[51583:813] matchedRange: {5, 2},//匹配到‘is‘   
  8. NSString *matchedString = [searchString substringWithRange:matchedRange];  
  9. NSLog(@"matchedString: '%@'" , matchedString);  
  10. // 2008-03-18 03:51:16.532 test[51583:813] matchedString: 'is' //生成子字符串   
  1. NSString *searchString = @"This is neat.";  
  2. NSString *regexString  = @"(//w+)//s+(//w+)//s+(//w+)";  
  3. NSRange   matchedRange = NSMakeRange(NSNotFound, 0UL);  
  4. NSError  *error        = NULL;  
  5. matchedRange = [searchString rangeOfRegex:regexString options:RKLNoOptions inRange:searchRange capture:2L error:&error];  
  6. NSLog(@"matchedRange: %@", NSStringFromRange(matchedRange));  
  7. // 2008-03-18 03:51:16.530 test[51583:813] matchedRange: {5, 2},//匹配到‘is‘  
  8. NSString *matchedString = [searchString substringWithRange:matchedRange];  
  9. NSLog(@"matchedString: '%@'", matchedString);  
  10. // 2008-03-18 03:51:16.532 test[51583:813] matchedString: 'is' //生成子字符串  


2.找到第一个匹配并返回一个NSString 
  1. NSString *searchString  = @ "This is neat." ;  
  2. NSString *regexString   = @"(//w+)//s+(//w+)//s+(//w+)" ;  
  3. NSString *matchedString = [searchString stringByMatching:regexString capture:2L];  
  4. NSLog(@"matchedString: '%@'" , matchedString);  
  5. // 2008-03-18 03:53:42.949 test[51583:813] matchedString: 'is'   
  1. NSString *searchString  = @"This is neat.";  
  2. NSString *regexString   = @"(//w+)//s+(//w+)//s+(//w+)";  
  3. NSString *matchedString = [searchString stringByMatching:regexString capture:2L];  
  4. NSLog(@"matchedString: '%@'", matchedString);  
  5. // 2008-03-18 03:53:42.949 test[51583:813] matchedString: 'is'  


3.查找和替换,加括号和概念和Python中的一样,$1指代第一个括号中的内容 
  1. NSString *searchString      = @ "This is neat." ;  
  2. NSString *regexString       = @"//b(//w+)//b" ;  
  3. NSString *replaceWithString = @"{$1}" ;  
  4. NSString *replacedString    = NULL;  
  5. replacedString = [searchString stringByReplacingOccurrencesOfRegex:regexString withString:replaceWithString];  
  6. //NSMutableString可以直接替换,并返回替换的次数   
  7. NSLog(@"replaced string: '%@'" , replacedString);  
  8. // 2008-07-01 19:03:03.195 test[68775:813] replaced string: '{This} {is} {neat}.'   
  9. NSMutableString *mutableString     = [NSMutableString stringWithString:@"This is neat." ];  
  10. NSString        *regexString       = @"//b(//w+)//b" ;  
  11. NSString        *replaceWithString = @"{$1}" ;  
  12. NSUInteger       replacedCount     = 0UL;  
  13. replacedCount = [mutableString replaceOccurrencesOfRegex:regexString withString:replaceWithString];  
  14. NSLog(@"count: %lu string: '%@'" , (u_long)replacedCount, mutableString);  
  15. // 2008-07-01 21:25:43.433 test[69689:813] count: 3 string: '{This} {is} {neat}.'   
  1. NSString *searchString      = @"This is neat.";  
  2. NSString *regexString       = @"//b(//w+)//b";  
  3. NSString *replaceWithString = @"{$1}";  
  4. NSString *replacedString    = NULL;  
  5. replacedString = [searchString stringByReplacingOccurrencesOfRegex:regexString withString:replaceWithString];  
  6. //NSMutableString可以直接替换,并返回替换的次数  
  7. NSLog(@"replaced string: '%@'", replacedString);  
  8. // 2008-07-01 19:03:03.195 test[68775:813] replaced string: '{This} {is} {neat}.'  
  9. NSMutableString *mutableString     = [NSMutableString stringWithString:@"This is neat."];  
  10. NSString        *regexString       = @"//b(//w+)//b";  
  11. NSString        *replaceWithString = @"{$1}";  
  12. NSUInteger       replacedCount     = 0UL;  
  13. replacedCount = [mutableString replaceOccurrencesOfRegex:regexString withString:replaceWithString];  
  14. NSLog(@"count: %lu string: '%@'", (u_long)replacedCount, mutableString);  
  15. // 2008-07-01 21:25:43.433 test[69689:813] count: 3 string: '{This} {is} {neat}.'  


4.用于拆分,返回一个拆分后的字符串数组 
  1. NSString *searchString = @ "This is neat." ;  
  2. NSString *regexString  = @"//s+" ;  
  3. NSArray  *splitArray   = NULL;  
  4. splitArray = [searchString componentsSeparatedByRegex:regexString];  
  5. // splitArray == { @"This", @"is", @"neat." }   
  6. NSLog(@"splitArray: %@" , splitArray);  
  1. NSString *searchString = @"This is neat.";  
  2. NSString *regexString  = @"//s+";  
  3. NSArray  *splitArray   = NULL;  
  4. splitArray = [searchString componentsSeparatedByRegex:regexString];  
  5. // splitArray == { @"This", @"is", @"neat." }  
  6. NSLog(@"splitArray: %@", splitArray);  


5.返回所有匹配的字符串数组,这个例子中虽然有多个括号,但是 componentsMatchedByRegex不管 
  1. NSString *searchString = @ "$10.23, $1024.42, $3099" ;  
  2. NSString *regexString  = @"//$((//d+)(?://.(//d+)|//.?))" ;  
  3. NSArray  *matchArray   = NULL;  
  4. matchArray = [searchString componentsMatchedByRegex:regexString];  
  5. // matchArray == { @"$10.23", @"$1024.42", @"$3099" };   
  6. NSLog(@"matchArray: %@" , matchArray);  
  7. 6.返回所有匹配的字符串数组处理所有的括号  
  8. NSString *searchString  = @"$10.23, $1024.42, $3099" ;  
  9. NSString *regexString   = @"//$((//d+)(?://.(//d+)|//.?))" ;  
  10. NSArray  *capturesArray = NULL;  
  11. capturesArray = [searchString arrayOfCaptureComponentsMatchedByRegex:regexString];  
  12. /* capturesArray ==  
  13. [NSArray arrayWithObjects:  
  14.  [NSArray arrayWithObjects:  @"$10.23",   @"10.23",   @"10", @"23", NULL],  
  15.  [NSArray arrayWithObjects:@"$1024.42", @"1024.42", @"1024", @"42", NULL],  
  16.  [NSArray arrayWithObjects:   @"$3099",    @"3099", @"3099",   @"", NULL],  
  17.  NULL];  
  18. */   
  19. NSLog(@"capturesArray: %@" , capturesArray);  
  20. 输出结果:  
  21. shell% ./capturesArray↵  
  22. 2009-05-06 03:25:46.852 capturesArray[69981:10b] capturesArray: (  
  23.        (  
  24.        "$10.23" ,  
  25.        "10.23" ,  
  26.        10,  
  27.        23  
  28.    ),  
  29.        (  
  30.        "$1024.42" ,  
  31.        "1024.42" ,  
  32.        1024,  
  33.        42  
  34.    ),  
  35.        (  
  36.        "$3099" ,  
  37.        3099,  
  38.        3099,  
  39.        ""   
  40.    )  
  41. )  
  1. NSString *searchString = @"$10.23, $1024.42, $3099";  
  2. NSString *regexString  = @"//$((//d+)(?://.(//d+)|//.?))";  
  3. NSArray  *matchArray   = NULL;  
  4. matchArray = [searchString componentsMatchedByRegex:regexString];  
  5. // matchArray == { @"$10.23", @"$1024.42", @"$3099" };  
  6. NSLog(@"matchArray: %@", matchArray);  
  7. 6.返回所有匹配的字符串数组处理所有的括号  
  8. NSString *searchString  = @"$10.23, $1024.42, $3099";  
  9. NSString *regexString   = @"//$((//d+)(?://.(//d+)|//.?))";  
  10. NSArray  *capturesArray = NULL;  
  11. capturesArray = [searchString arrayOfCaptureComponentsMatchedByRegex:regexString];  
  12. /* capturesArray == 
  13. [NSArray arrayWithObjects: 
  14.  [NSArray arrayWithObjects:  @"$10.23",   @"10.23",   @"10", @"23", NULL], 
  15.  [NSArray arrayWithObjects:@"$1024.42", @"1024.42", @"1024", @"42", NULL], 
  16.  [NSArray arrayWithObjects:   @"$3099",    @"3099", @"3099",   @"", NULL], 
  17.  NULL]; 
  18. */  
  19. NSLog(@"capturesArray: %@", capturesArray);  
  20. 输出结果:  
  21. shell% ./capturesArray↵  
  22. 2009-05-06 03:25:46.852 capturesArray[69981:10b] capturesArray: (  
  23.        (  
  24.        "$10.23",  
  25.        "10.23",  
  26.        10,  
  27.        23  
  28.    ),  
  29.        (  
  30.        "$1024.42",  
  31.        "1024.42",  
  32.        1024,  
  33.        42  
  34.    ),  
  35.        (  
  36.        "$3099",  
  37.        3099,  
  38.        3099,  
  39.        ""  
  40.    )  
  41. )

原创粉丝点击