探究printf

来源:互联网 发布:mac jmeter下载安装 编辑:程序博客网 时间:2024/05/01 11:14

对printf的探究始于几个问题
1、
short a, b;
printf(“a=%d b=%d”, a, b);
%d是用来打印有符号整型int类型,那它这样打印会不会有问题,比如寻址越界,但是发现其实都能够打印正常,所以应该不会有寻址越界问题。
%c打印出的是ASCII码,字符‘8’,十进制是56
unsigned char a = 56;
printf(“a=%c %d”, a, a);
打印结果: 8 56

2、printf的实现原理究竟是怎样的,它是如何实现可变参数的。
现在我们仍然采用汇编语言以及阅读printf源码来解决疑问。
typedef struct Array{
short a;
short b;
short c;
short d;
char e[10];
};

int mani()
{
Array s = {10, 8, 9, 7, 11,12, 13, 14,15,16, 17, 18, 19, 20};
printf(“s.a=%c s.b=%c s.c=%c s.d=%c s.e[%c %c %c %c %c %c %c %c %c %c]”,
s.a, a.b, s.c, s.d, s.e[0], s.e[1], s.e[2], s.e[3], s.e[4], s.e[5], s.e[6], s.e[7], s.e[8], s.e[9]);
}
汇编语言的核心部分:
初始化Array s
movw 10,80(movw8, -78(%rbp)
movw 9,76(movw7, -74(%rbp)
movb 11,72(movb12, -71(%rbp)
….
movb $20, -63(%rbp)
将printf的入参压入栈
movzbl -63(%rbp), %eax
movsbl %al, %r13d
movzbl -62(%rbp), %eax
movsbl %al, %r12d
….
movzwl -80(%rbp), %eax
movl %r13d, 64(%rsp)
movl %r12d, 56(%rsp)
movl %r11d, 48(%rsp)
….
call printf
通过上述汇编语言,我们可以巩固一下很多知识点
1)函数的入参是从右到左入栈的,也就是说第一个参数离着被调用函数最近
2)之所以将十几个参数传入printf,是为了查看入栈的过程,不然几个参数的话都会被放入寄存器中,就不会观察到上面所说是否有越界访问的问题
3)虽然是字符类型,但是入参在栈中是占用8个字节,short、int类型亦是如此,所以根本不会存在越界访问的问题,唯一存在的问题有,%u打印有符号或者有符号打印%u,存在错误,还有就是%s打印字符串时,如果误传入整型,造成程序崩溃
接下来我们看一下Printf的源码
printf的一种实现(libc下printf.c)
int printf(const char *fmt, …)
{
int ret;
va_list ap;
va_start(ap, fmt); //ap指向了第二个入参地址
ret = vfprintf(stdout, fmt, ap);
va_end(ap);
return ret;
}
va_list、va_start的宏定义 #define _INTSIZEOF(n) \ ((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) ) #define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) ) #define va_arg(ap,t) \ ( (t )((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) ) #define va_end(ap) ( ap = (va_list)0 )
typedef char* va_list;
va_arg宏做了两件事情,第一件事情是先把ap指针指向下一个入参,第二件事情是将ap减去当前入参的大小,重新得到当前入参的位置,强制转换成当前入参。一开始对ap如何指向下一个入参存在疑问。原来是先指向下一个,然后再用临时变量返回。
关于vfprintf,没有继续深究,基本原理应该也是按上面的8字节寻址,知道解析完fmt.

最后贴一个va_list的示例代码:
下面是va_list的用法示例 包含的头文件stdarg.h:
int AveInt(int,…);
void main()
{
printf(“%d/t”,AveInt(2,2,3));
printf(“%d/t”,AveInt(4,2,4,6,8));
return;
}
int AveInt(int v,…)
{
int ReturnValue=0;
int i=v;
va_list ap ;
va_start(ap,v);
while(i>0)
{
ReturnValue+=va_arg(ap,int) ;
i–;
}
va_end(ap);
return ReturnValue/=v;
}
2016/04/21:讲到一个异步信号安全函、可重入函数、线程安全函数,对于printf这类函数,它们使用了全局数据结构(iobuffer),所以不是线程安全的(多个线程同时访问共享资源),也是不可重入的(有共享资源,可能损坏);
一个可重入函数意味着可以被中断,可重入函数与异步信号函数是等价的,是线程安全函数的真子集。

0 0