strlen()分析

来源:互联网 发布:油烟机品牌 知乎 编辑:程序博客网 时间:2024/05/16 19:09

今天在一个帖上讨论strlen()效率的问题,我找了glibc-2.9的源代码,觉得人家确实在效率上绞尽脑汁!

函数实现的基本思想是,开始逐个处理每个字符直到unsigned long int的边界(整数倍),接着以四字节(unsigned long int)为单位进行处理。代码如下:

 

处理方式如下:

构造一个magic_bits = (01111110 11111110 11111110 11111111),在它的31, 24, 16,8位(标志位)都是0,这样当它与比较的四字符longword(转化为unsigned long int)相加后,如果longword中某个字节(注意,不是位!)不是0,就会将31, 24, 16,8中的某一位改变(通过传递进位)。当然,如果在31, 24, 16,8中某个有进位并且longword对应位也为1,那么,结果是多个标志位将会改变改变。大家可以参考注释理解。

 

注释中提到一个唯一的“盲区”,就是第31位,如果longword的31为1,而30-24都为0,那么相加之后longword的31位没有改变,即这样的一个字符可能会被检测为0!也就是说,特定位置的128使用这种方法会被判定为零!但是,在后面的检测哪一字符为0时是逐个比较的,因此误判为0也没有关系,会往后继续运行。

原创粉丝点击