Linux中常用字符串函数的实现

来源:互联网 发布:c#json转list对象集合 编辑:程序博客网 时间:2024/05/15 23:45

/*strcpy()函数的实现*/
1 函数原型
    char *strcat(char *dest, const char *src);
2 函数用法
    #include <string.h>
3 函数功能
    把从src地址开始且含有NULL结束符的字符串复制到以dest开始的地址空间。
4 函数说明
    src和dst指针不能为空且他们所指内存区域不可以重叠,dst必须有足够的空间来容纳src字符串。
5 函数源码

  1 #include <stdio.h>  2 #include <assert.h>  3 char *my_strcpy(char *dst,const char *src)  4 {  5         assert((dst!=NULL)&&(src!=NULL));//[1]  6         char *my_dst = dst;//[3]/*保存dst指针*/  7         while((*dst++ = *src++) != '\0')//[4]/*拷贝src字符串到dst*/  8         NULL;  9         return my_dst;//[2]/*返回my_dst字符串指针*/ 10 }
一、 错误的做法:[1] (A)不检查指针的有效性,说明答题者不注重代码的健壮性。 (B)检查指针的有效性时使用((!strDest)||(!strSrc))或(!(strDest&&strSrc)), 说明答题者对C语言中类型的隐式转换没有深刻认识。在本例中char *转换为bool即是类型隐式 转换,这种功能虽然灵活,但更多的是导致出错概率增大和维护成本升高。所以C++专门增加了 bool、true、false三个关键字以提供更安全的条件表达式。 (C)检查指针的有效性时使用((strDest==0)||(strSrc==0)),说明答题者不知道使用常量 的好处。直接使用字面常量(如本例中的0)会减少程序的可维护性。0虽然简单,但程序中可能 出现很多处对指针的检查,万一出现笔误,编译器不能发现,生成的程序内含逻辑错误,很难排 除。而使用NULL代替0,如果出现拼写错误,编译器就会检查出来。[2] (A)return new string("Invalid argument(s)");,说明答题者根本不知道返回值的用途,并 且他对内存泄漏也没有警惕心。从函数中返回函数体内分配的内存是十分危险的做法,他把释放 内存的义务抛给不知情的调用者,绝大多数情况下,调用者不会释放内存,这导致内存泄漏。 (B)return 0;,说明答题者没有掌握异常机制。调用者有可能忘记检查返回值,调用者还可能 无法检查返回值(见后面的链式表达式)。妄想让返回值肩负返回正确值和异常值的双重功能, 其结果往往是两种功能都失效。应该以抛出异常来代替返回值,这样可以减轻调用者的负担、使 错误不会被忽略、增强程序的可维护性。[3] (A)忘记保存原始的strDest值,说明答题者逻辑思维不严密。[4] (A)循环写成while (*strDest++=*strSrc++);,同[1](B)。 (B)循环写成while (*strSrc!='\0') *strDest++=*strSrc++;,说明答题者对边界条件的检 查不力。循环体结束后,strDest字符串的末尾没有正确地加上'\0'。二、返回strDest的原始值使函数能够支持链式表达式,增加了函数的“附加值”。同样功能的函数,如果能合理地提高的可用性,自然就更加理想。

 链式表达式的形式如:
 1 int iLength = strlen(strcpy(strA,strB));
 又如:
 1 char * strA=strcpy(new char[10],strB);

三、返回strSrc的原始值是错误的。其一,源字符串肯定是已知的,返回它没有意义。其二,
不能支持形如第二例的表达式。其三,为了保护源字符串,形参用const限定strSrc所指的内容,
把const char *作为char *返回,类型不符,编译报错。

 

 /*strcat()函数的实现*/
1 函数原型
    char *strcpy(char *dest, const char *src);
2 函数用法
    #include <string.h>
3 函数功能
    把src字符串连接到dst后面,src字符串内容不变。
4 函数说明
    src和dst指针不能为空且他们所指内存区域不可以重叠,dst必须有足够的空间来容纳src字符串。
5 函数源码

  1 #include <stdio.h>  2 #include <assert.h>  3 char *my_strcat(char *dst,const char *src)  4 {  5         assert((dst != NULL)&&(src != NULL));  6         char *my_dst = dst;/*保存dst指针*/  7         while(*my_dst != '\0')  8                 my_dst++;/*查找dst字符串的末尾*/  9         while((*my_dst++ = *src++) != '\0');/*拷贝字符串到dst后面*/ 10         return dst;/*返回dst字符串的指针*/ 11 }


 

 
/*strcmp()函数的实现*/
1 函数原型
    int strcmp(const char *s1, const char *s2);
2 函数用法
    #include <string.h>
3 函数功能
    比较s1与s2两个字符串是否相等,返回一个等于0、小于0,或大于0的整数.
4 函数说明
    s1和s2指针不能为空且他们所指内存区域不可以重叠。
5 函数源码

  1 #include <stdio.h>  2   3 int my_strcmp(const char*s1,const char*s2)  4 {  5         while(*s1!=0 && *s2!=0 && *s1==*s2)//判断S1和S2对应的字符是不是为空,相同,如果为空,或者不相同跳出循环  6         {  7                 *s1++;  8                 *s2++;  9         }        10         return *s1-*s2;/* S1和S2相等的时候返回0;如果不同,返回S1和S2的ASCII之差;*/ 11 }  



 
 
 /*strlen()函数的实现*/
1 函数原型
    size_t strlen(const char *s);
2 函数用法
    #include <string.h>
3 函数功能
    该函数得到一个字符串的长度,但是不包含字符串末尾的‘\0’.
4 函数说明
    s所指的内存空间不能为空。
5 函数源码 

  1 #include <stdio.h>  2 #include <assert.h>  3   4 int my_strlen(const char *str)  5 {  6         int len = 0;  7         assert(str !=NULL);/*判断字符串地址非0*/  8         while(*str++ != '\0')  9         len++; 10         return len; 11 }



 /*不用任何中间变量的*/

  3 int my_strlen(const char*strDest)  4 {  5     assert(NULL != strDest);  6     if('\0' == *strDest)  7     {  8         return 0;  9     } 10     else 11     { 12         return(1 + my_strlen(++strDest)); 13     } 14 }



区别
 strlen(char*)函数求的是字符串的实际长度,它求得方法是从开始到遇到第一个'\0',
 如果你只定义没有给它赋初值,这个结果是不定的,它会从aa首地址一直找下去,直到
 遇到'\0'停止。
char aa[10];cout<<strlen(aa)<<endl; //结果是不定的
char aa[10]={'\0'}; cout<<strlen(aa)<<endl; //结果为0
char aa[10]="jun"; cout<<strlen(aa)<<endl; //结果为3
 而sizeof()返回的是变量声明后所占的内存数,不是实际长度,此外sizeof不是函数,
仅仅是一个操作符,strlen是函数。
sizeof(aa) 返回10
int a[10]; sizeof(a) 返回40 (根据语言int型 c 是两个字节 c++是四个 java 是两个)
 ⒈sizeof操作符的结果类型是size_t,它在头文件中typedef为unsigned int类型。
该类型保证能容纳实现所建立的最大对象的字节大小。
 ⒉sizeof是操作符(关键字),strlen是函数。
 ⒊sizeof可以用类型做参数,strlen只能用char*做参数,且必须是以''\0''结尾的。
sizeof还可以用函数做参数,比如:
short f();
printf("%d\n",sizeof(f()));
输出的结果是sizeof(short),即2。
 ⒋数组做sizeof的参数不退化,传递给strlen就退化为指针了。
 ⒌大部分编译程序 在编译的时候就把sizeof计算过了是类型或是变量的长度这就是sizeof(x)
可以用来定义数组维数的原因
char str[20]="0123456789";
int a=strlen(str); //a=10;
int b=sizeof(str); //而b=20;
 6.strlen的结果要在运行的时候才能计算出来,是用来计算字符串的长度,不是类型
占内存的大小。
 7.sizeof后如果是类型必须加括弧,如果是变量名可以不加括弧。这是因为sizeof是
个操作符不是个函数。
 ⒏当适用了于一个结构类型时或变量, sizeof 返回实际的大小,
当适用一静态地空间数组, sizeof 归还全部数组的尺寸。
sizeof 操作符不能返回动态地被分派了的数组或外部的数组的尺寸
 ⒐数组作为参数传给函数时传的是指针而不是数组,传递的是数组的首地址,
如:
fun(char [8])
fun(char [])
都等价于 fun(char *)
在C++里参数传递数组永远都是传递指向数组首元素的指针,编译器不知道数组的大小
如果想在函数内知道数组的大小, 需要这样做:
进入函数后用memcpy拷贝出来,长度由另一个形参传进去
fun(unsiged char *p1,int len){  unsigned char* buf = new unsigned char[len+1]  memcpy(buf,p1,len);}
我们能常在用到 sizeof 和 strlen 的时候,通常是计算字符串数组的长度
看了上面的详细解释,发现两者的使用还是有区别的,从这个例子可以看得很清楚:
char str[20]="0123456789";
int a=strlen(str); //a=10; >>>> strlen 计算字符串的长度,以结束符 0x00 为字符串结束。
int b=sizeof(str); //而b=20; >>>> sizeof 计算的则是分配的数组 str[20] 所占的内存空间的大小,不受里面存储的内容改变。
上面是对静态数组处理的结果,如果是对指针,结果就不一样了
char* ss = "0123456789";
sizeof(ss) 结果 4 ===》ss是指向字符串常量的字符指针,sizeof 获得的是一个指针的值所占的空间,应该是长整型的,所以是4
sizeof(*ss) 结果 1 ===》*ss是第一个字符 其实就是获得了字符串的第一位'0' 所占的内存空间,是char类型的,占了 1 位
strlen(ss)= 10 >>>> 如果要获得这个字符串的长度,则一定要使用 strlen
sizeof返回对象所占用的字节大小. //正确
strlen返回字符个数. //正确
在使用sizeof时,有一个很特别的情况,就是数组名到指针蜕变,
char Array[3] = {'0'};
sizeof(Array) == 3;
char *p = Array;
strlen(p) == 1;//sizeof(p)结果为4
在传递一个数组名到一个函数中时,它会完全退化为一个指针
----------------------------------------------------------
看完以上你是否很清楚sizeof和strlen的区别了呢?还不明白的话,我们看下面几个例子:
第一个例子
char* ss = "0123456789";
sizeof( ss) 结果 4 ===》ss是指向字符串常量的字符指针
sizeof(*ss) 结果 1 ===》*ss是第一个字符
大部分编译程序 在编译的时候就把sizeof计算过了 是类型或是变量的长度
这就是sizeof(x)可以用来定义数组维数的原因
char str[20]="0123456789";
int a=strlen(str); //a=10;
int b=sizeof(str); //而b=20;
char ss[] = "0123456789";
sizeof(ss) 结果 11 ===》ss是数组,计算到\0位置,因此是10+1
sizeof(*ss) 结果 1 ===》*ss是第一个字符
char ss[100] = "0123456789";
sizeof(ss) 结果是100 ===》ss表示在内存中的大小 100×1
strlen(ss) 结果是10 ===》strlen是个函数,内部实现是用一个循环计算到\0之前为止
int ss[100] = "0123456789";
sizeof(ss) 结果 400 ===》ss表示再内存中的大小 100×4
strlen(ss) 错误 ===》strlen的参数只能是char* 且必须是以'\0'结尾的
char q[]="abc";
char p[]="a\n";
sizeof(q),sizeof(p),strlen(q),strlen(p);
结果是 4 3 3 2
第二个例子
class X{  int i;  int j;  char k;};X x;
cout<<sizeof(X)<<endl; 结果 12 ===》内存补齐
cout<<sizeof(x)<<endl; 结果 12 同上
第三个例子
char szPath[MAX_PATH]
 如果在函数内这样定义,那么sizeof(szPath)将会是MAX_PATH,但是将
szPath作为虚参声明时(void fun(char szPath[MAX_PATH])),sizeof(szPath)
却会是4(指针大小)
还有一位网友的说明也很好:
 其实理解 sizeof 只需要抓住一个要点:栈
程序存储分布有三个区域:栈、静态和动态。能够从代码直接操作的对象,
包括任何类型的变量、指针,都是在栈上的;动态和静态存储区是靠栈上的
指针来间接操作的。sizeof 操作符,计算的是对象在栈上的投影体积;记住
这个就很多东西都很清楚了。
char const * static_string = "Hello";
sizeof(static_string) 是 sizeof 一个指针,所以在 32bit system 是 4
char stack_string[] = "Hello";
sizeof(stack_string) 是 sizeof 一个数组,所以是 6 * sizeof(char)
char * string = new char[6];
strncpy(string,"Hello",6");
sizeof(string) 是 sizeof 一个指针,所以还是 4。
和第一个不同的是,这个指针指向了动态存储区而不是静态存储区。
不管指针指向的内容在什么地方,sizeof 得到的都是指针的栈大小
C++ 中对引用的处理比较特殊;sizeof 一个引用得到的结果是 sizeof 一个被引用的对象的大小;所以
struct O{  int a,b,c,d,e,f,g,h;};int main(){  O & r = *new O;  cout << sizeof(O) << endl;
 // 32  cout << sizeof r << endl; // 也是 32  system("PAUSE");}
r 引用的是整个的 O 对象而不是指向 O 的指针,所以 sizeof r 的结果和 sizeof O 完全相同。
自定义函数实现strlen()函数的功能

 
 /*memcpy()函数的实现*/
1 函数原型
    void *memcpy(void *dest, const void *src, size_t n);
2 函数用法
    #include <string.h>
3 函数功能
    从源src所指的内存地址的起始位置开始拷贝n个字节到目标dest所指的内存地址的起始位置中.
4 函数说明
    1.source和destin所指的内存区域可以重叠,但是如果source和destin所指的内存区域重叠,
那么这个函数并不能够确保source所在重叠区域在拷贝之前被覆盖。而使用memmove可以用来
处理重叠区域。函数返回指向destin的指针。
 2.strcpy和memcpy主要有以下3方面的区别。
 2.1、复制的内容不同。strcpy只能复制字符串,而memcpy可以复制任意内容,例如字符数组、
整型、结构体、类等。
 2.2、复制的方法不同。strcpy不需要指定长度,它遇到被复制字符的串结束符"\0"才结束,
所以容易溢出。memcpy则是根据其第3个参数决定复制的长度。
 2.3、用途不同。通常在复制字符串时用strcpy,而需要复制其他类型数据时则一般用memcpy
 3.如果目标数组destin本身已有数据,执行memcpy()后,将覆盖原有数据(最多覆盖n)。
如果要追加数据,则每次执行memcpy后,要将目标数组地址增加到你要追加数据的地址。
 注意:source和destin都不一定是数组,任意的可读写的空间均可。
5 函数源码

  1 #include <stdio.h>  2 #include <assert.h>  3 void *my_memcpy(void *dest,const void *src,size_t n)  4 {  5         assert(dest != NULL && src != NULL);  6         char *ret = (char *)dest;  7         char *my_dest = ret;  8         char *my_src = (char *)src;  9         while(n--) 10                 *my_dest++ = *my_src++; 11         return ret; 12 }



 

原创粉丝点击