字符串切割函数strtok、strtok_s、strtok_r的区别

来源:互联网 发布:java技术架构图工具 编辑:程序博客网 时间:2024/05/14 08:00

strtok函数

头文件#include <string.h>
函数原型char * strtok (char *str, const char * delimiters);
参数str:待分割的字符串(c-string);delimiters:分割符字符串。
该函数用来将字符串分割成一个个片段。参数str指向欲分割的字符串,参数delimiters则为分割字符串中包含的所有字符。当strtok()在参数s的字符串中发现参数delimiters中包涵的分割字符时,则会将该字符改为\0 字符。在第一次调用时,strtok()必需给予参数s字符串,往后的调用则将参数s设置成NULL。每次调用成功则返回指向被分割出片段的指针。
需要注意的是,使用该函数进行字符串分割时,会破坏被分解字符串的完整,调用前和调用后的s已经不一样了。第一次分割之后,原字符串str是分割完成之后的第一个字符串,剩余的字符串存储在一个静态变量中,因此多线程同时访问该静态变量时,则会出现错误。

代码举例

例1:将字符串通过’,’分割开,打印子串并判断原字符串(被分割的字符串)是否发生改变

#include <stdio.h>#include <string.h>int main(){    char str[]="ab,cd,ef";    char *ptr;    printf("before strtok:  str=%s\n",str);    printf("begin:\n");    ptr = strtok(str, ",");    while(ptr != NULL){        printf("str=%s\n",str);        printf("ptr=%s\n",ptr);        ptr = strtok(NULL, ",");    }    return 0;}

输出结果
before strtok: str=ab,cd,ef
begin:
str=ab
ptr=ab
str=ab
ptr=cd
str=ab
ptr=ef

例2:MSDN例子,字符串中含有多个分隔符

#include <string.h>#include <stdio.h>char string[] = "A string\tof ,,tokens\nand some  more tokens";//被分割的字符串char seps[]   = " ,\t\n";//分隔符集char *token;//用指针作为标记void main( void ){   printf( "%s\n\nTokens:\n", string );   /* 建立字符串并获取第一个标记(指向子串的首地址) */   token = strtok( string, seps );   while( token != NULL )   {      /* 在“string”中有标记*/      printf( " %s\n", token );      /* 得到下一个标记*/      token = strtok( NULL, seps );   }}

输出结果
A string of ,,tokens
and some more tokens

Tokens:
A
string
of
tokens
and
some
more
tokens

结论:strtok在切割字符串的过程,实际上就是将被分割的字符串的分隔字符替换为‘\0’ 并且返回标记字符串的首地址,直到返回NULL结束。

stotok函数的实现原理

函数代码

#include<stdio.h>#include<string.h>//根据函数原型实现strtok()函数char* myStrtok_origin(char* str_arr,const char* delimiters,char** temp_str){    //定义一个指针来指向待分解串    char* b_temp;    /*    * 1、判断参数str_arr是否为空,如果是NULL就以传递进来的temp_str作为起始位置;    * 若不是NULL,则以str为起始位置开始切分。    */    if(str_arr == NULL)    {        str_arr =*temp_str;    }    //2、跳过待分解字符串    //扫描delimiters字符开始的所有分解符    str_arr += strspn(str_arr, delimiters);//寻找第一个子串,返回子串的长度    //3、判断当前待分解的位置是否为'\0',若是则返回NULL,否则继续    if(*str_arr =='\0')    {        return NULL;    }    /*    * 4、保存当前的待分解串的指针b_temp,调用strpbrk()在b_temp中找分解符,    * 如果找不到,则将temp_str赋值为待分解字符串末尾部'\0'的位置,    * b_temp没有发生变化;若找到则将分解符所在位置赋值为'\0',    * b_temp相当于被截断了,temp_str指向分解符的下一位置。    */    b_temp = str_arr;    str_arr = strpbrk(str_arr, delimiters);    if(str_arr == NULL)    {        *temp_str = strchr(b_temp,'\0');    }    else    {        *str_arr ='\0';        *temp_str = str_arr +1;    }    //5、函数最后部分无论找没找到分解符,都将b_temp返回。    return b_temp;}//使用myStrtok来简化myStrtok_origin函数char* myStrtok(char* str_arr,const char* delimiters){    static char* last;//静态变量    return myStrtok_origin(str_arr, delimiters,&last);}int main(void){    char buf[]="hello@boy@this@is@heima";    //1、使用myStrtok_origin()函数    char*temp_str = NULL;    char*str = myStrtok_origin(buf,"@",&temp_str);    while(str)    {        printf("%s ",str);        str = myStrtok_origin(NULL,"@",&temp_str);    }    //2、使用myStrtok()函数    char*str1 = myStrtok(buf,"@");    while(str1)    {        printf("%s ",str1);        str1 = myStrtok(NULL,"@");    }    return 0;}

输出结果:
hello boy this is heima hello

strtok_s函数

strtok_s是Windows下的一个分割字符串安全函数,其函数原型
char *strtok_s( char *strToken, const char *strDelimit, char **buf);
数将剩余的字符串存储在buf变量中,而不是静态变量中,从而保证了安全性。

代码示例

例1:使用strtok_s函数分隔字符串

#include <stdio.h>#include <string.h>int main(){    char str[]="ab,cd,ef";    char *ptr;    printf("before strtok:  str=%s\n",str);    printf("begin:\n");    char *pTmp = NULL;    ptr = strtok_s(str,",",&pTmp);    while(ptr != NULL)    {        printf("str=%s\n",str);        printf("ptr=%s\n",ptr);        ptr = strtok_s(NULL,",",&pTmp);    }    return 0;}

输出结果
before strtok: str=ab,cd,ef
begin:
str=ab
ptr=ab
str=ab
ptr=cd
str=ab
ptr=ef

strtok_r函数

strtok_s函数是linux下分割字符串的安全函数,函数声明如下:
char *strtok_r(char *str, const char *delim, char **saveptr);
(1)该函数也会破坏带分解字符串的完整性,但是其将剩余的字符串保存在saveptr变量中,保证了安全性。
(2)在函数strtok中剩余字符串是存储在一个静态变量中,因此,多线程在使用该静态变量时引起冲突;而strtok_r则使用用户传入的指针为每个用户saveptr重新申请变量,因而可以保证线程安全。
(3)strtok_r函数是strtok函数的可重入版本,也即线程安全版本。str为要分解的字符串,delim为分隔符字符串。char *saveptr参数是一个指向char 的指针变量,用来在strtok_r内部保存切分时的上下文,以应对连续调用分解相同源字符串。

代码示例

#include <stdio.h>#include <string.h>int main(){    char str[]="ab,cd,ef";    char *ptr;    char *p;    printf("before strtok:  str=%s\n",str);    printf("begin:\n");    ptr = strtok_r(str, ",", &p);    while(ptr != NULL){        printf("str=%s\n",str);        printf("ptr=%s\n",ptr);        ptr = strtok_r(NULL, ",", &p);    }    return 0;}

输出结果
strtok_r.c

拓展:
可重入函数:
  (1)重入即表示重复进入,首先它意味着这个函数可以被中断,其次意味着它除了使用自己栈上的变量以外不依赖于任何环境(包括static),这样的函数就是purecode(纯代码)可重入,可以允许有该函数的多个副本在运行,由于它们使用的是分离的栈,所以不会互相干扰。如果确实需要访问全局变量(包括static),一定要注意实施互斥手段。可重入函数在并行运行环境中非常重要,但是一般要为访问全局变量付出一些性能代价。
   (2)指一个可以被多个任务调用的函数(过程),任务在调用时不必担心数据是否会出错。
不可重入函数:
  如果函数接口的代码实现中在块内定义和使用了static存储类型的变量,这种函数将是不可重入函数。它在实时系统中是不安全函数。
  
参考:http://blog.csdn.net/jiangqin115/article/details/48545895
http://www.cnblogs.com/Bob-tong/p/6610806.html
http://blog.csdn.net/lavorange/article/details/47134121

阅读全文
0 0
原创粉丝点击