功能强大的sscanf 函数

来源:互联网 发布:jq push 数组 编辑:程序博客网 时间:2024/06/06 08:30

函数原型:

 

Int sscanf( const char * src, const char * format, ...);

int scanf( const char * format, ...);

这两个函数很相似,只是第一个函数以src作为输入,而第二个函数以标准输入STDIN读取输入;

format 是格式控制字符串,它包含控制字符(如:%d,%i,%s等),空白字符(如:空格、制表符\t、回车换行符\n 或其连续组合)以及非空白字符;

...是一组指针变量,是上述函数用来保存结果值的;

返回值为被成功赋值的指针变量的个数,如果该函数发生错误,则返回EOF(-1)。

 

格式控制format:

 

format可以是一个或多个 {%[*] [width] [{h | l | I64 | L}]type | 空白字符| 非空白符号}

该公式中符号解释如下:

{a|b|c}:表示a,b,c中选一或几个;

[d]:表示可以有d也可以没有d;

* :亦可用于格式中, (即 %*d 和 %*s) 加了星号 (*) 表示跳过此数据不读入. (也就是不把此数据读入参数中) ,用法如:

 

const char sourceStr[] = "hello, world"; char buf[10] = ; sscanf(sourceStr, "%*s%s", buf); //%*s表示第一个匹配到的%s被过滤掉,即hello被过滤了 cout << buf<< endl; 结果为:world 


width:宽度,一般可以忽略,用法如:

const char sourceStr[] = "hello, world"; char buf[10] = ; sscanf(sourceStr, "%5s", buf); //%5s,只取5个字符 cout << buf<< endl; 结果为:hello 

{h | l | I64 | L}:参数的size,通常h表示单字节size,I表示2字节 size,L表示4字节size(double例外),l64表示8字节size;

type:即为控制字符如:d, i, f, s, p, 及集合[ ],(注意%号写在了最前面了,这里不能再加一个%号了。)  需特别注意和说明的控制符是集合%[ ]:

         

%[a-z] 表示匹配a到z中任意字符,贪婪性(尽可能多的匹配) %[aB'] 匹配a、B、'中一员,贪婪性 %[^a] 匹配非a的任意字符,贪婪性 

 

例如取遇到空格为止字符串:

sscanf("123456 abcdedf", "%[^ ]", buf); printf("%s\n", buf); 结果为:123456 

再如:

const char* s = "iios/12DDWDFF@122"; char buf[20]; sscanf( s, "%*[^/]/%[^@]", buf ); printf( "%s\n", buf ); 结果为:12DDWDFF先将 "iios/"过滤掉,再将到字符'@'为止的一串12DDWDFF


 

空白字符:空格' ', 回车换行 '\n', 制表符 '\t' 等;

非空白字符:即一般字符。
 

格式匹配过程:

 

该函数从源(src 或STDIN)的前面顺序读取一个或一段字符(不管是不是空白字符),并从格式控制字符串中与之对应的位置取得字符或字符串(格式控制字符串、空白字符或非空白字符),将二者进行比较匹配,则该字符(串)被匹配的情况有四种可能:

1. 当遇到一个空白字符时,则若能匹配上,也跳过,若匹配不上,也跳过;

2. 当遇到一个非空白字符时,进行比较,如果匹配,则跳过,如果不能匹配,则结束匹配过程;

3. 当遇到控制字符时,如果能匹配上,则按照控制字符的意义将从源读取的字符或字符串存入到下一个指针指向地址处,如果不能匹配上,则结束匹配过程;

特别注意的是:

如果控制字符里有width,则会将最多这么多字符串存进下一个指针指向的地址处;

如果是控制符%[],则将源中字符串自当前位置开始到第一个不符合该控制符规定的匹配字符的所有字符存储到下一个指针指向的地址处。

4. 如果不能跟从格式控制字符串里与之相应位置处取得的字符或字符串相匹配,则整个匹配过程结束。

 

常见例子:

 

1. 常见用法。

char buf[512] ;

sscanf("123456 ", "%s", buf);//此处buf是数组名,它的意思是将123456以%s的形式存入buf中!

printf("%s\n", buf);

结果为:123456

2. 取指定长度的字符串。如在下例中,取最大长度为4字节的字符串。

sscanf("123456 ", "%4s", buf);

printf("%s\n", buf);

结果为:1234

3. 取到指定字符为止的字符串。如在下例中,取遇到空格为止字符串。

sscanf("123456 abcdedf", "%[^ ]", buf);

printf("%s\n", buf);

结果为:123456

4. 取仅包含指定字符集的字符串。如在下例中,取仅包含1到9和小写字母的字符串。

sscanf("123456abcdedfBCDEF", "%[1-9a-z]", buf);

printf("%s\n", buf);

结果为:123456abcdedf

当输入:

sscanf("123456abcdedfBCDEF","%[1-9A-Z]",buf);

printf("%s\n",buf);

结果为:123456

5. 取到指定字符集为止的字符串。如在下例中,取遇到大写字母为止的字符串。

sscanf("123456abcdedfBCDEF", "%[^A-Z]", buf);

printf("%s\n", buf);

结果为:123456abcdedf

6、给定一个字符串iios/12DDWDFF@122,获取 / 和 @ 之间的字符串,先将 "iios/"过滤掉,再将非'@'的一串内容送到buf中

sscanf("iios/12DDWDFF@122", "%*[^/]/%[^@]", buf);

printf("%s\n", buf);

结果为:12DDWDFF

7、给定一个字符串"hello, world”,仅保留world。(注意:“,”之后有一空格)

sscanf(“hello, world”, "%*s%s", buf);

printf("%s\n", buf);

结果为:world

%*s表示第一个匹配到的%s被过滤掉,即hello被过滤了

如果没有空格则结果为NULL。

 8.处理2006:03:18 - 2006:04:18(‘-’两边有空格)和2006:03:18-2006:04:18(‘-’两边无空格):

前者:

char sztime1[16] = "", sztime2[16] = "";

sscanf("2006:03:18 - 2006:04:18", "%s - %s", sztime1, sztime2);


后者:

char sztime1[16] = "", sztime2[16] = "";

sscanf("2006:03:18-2006:04:18", "%[0-9,:]-%[0-9,:]", sztime1, sztime2);