由errno到linux的tls实现机制

来源:互联网 发布:vscode离线插件安装 编辑:程序博客网 时间:2024/06/06 05:47

1. 起因:

在使用gdb调试程序时,碰到的一个问题导致了本次对tls的学习。该问题是:被调试程序调用了一个库函数后,对errno进行判断。而我希望知道errno的具体的值,所以就直接使用“print errno”命令。这时候竟然出现“can't access memory ...”。接下来,我就尝试了在源程序中加入一行printf("%d",errno).的语句,结果是能打印出errno的值。那么下面问题来了:(1)errno究竟是个什么东西?(2)为什么printf()函数能访问,gdb的print命令不能访问errno呢?

2. errno的分析

首先,网上查资料。解释是errno是C库中的一个整型变量。用于记录前一次系统调用的返回的错误码,因为系统调用执行错误只会返回-1。那么就可以从errno的值来确定问题所在。在之前单线程的c库中,errno被定义成一个全局变量,当系统调用发生错误时,c库与os以一定的机制(比如寄存器传递的方式)将错误号放入errno中。但是多线程产生后,问题就来了,多线程对全局变量会产生竞争,线程A系统调用出错,线程B去访问errno,得到错误的结果。所以c库对errno新的实现是把errno作为一个tls变量。

接来下,通过实验来见证一下errno的真实面貌。编写一个小程序 hello.c “#include <error.h>”,然后预编译“gcc -E hello.c  -o hello.i”。可以在hello.i里面看到error.h展开的内容。其中errno的定义如下

“extern int *__errno_location (void) __attribute__ ((__nothrow__)) __attribute__((__const__)); #define errno (*errno_location ())”。 errno是通过函数__errno_location()的返回值得到的。该函数的__const__属性,这里也稍作说明,该属性告诉编译器该函数执行一遍,第二次执行的时候直接返回它第一次返回值即可。也就是说对于一个线程,这个errno的地址是固定的。

那么__errno_location()函数究竟是怎么实现的呢?接下来,我们翻翻glibc的代码。由于之前没怎么接触过glibc的源码,对代码结构也不熟悉,只能傻傻grep了。首先在nptl目录下找到一个errno-loc.c,但是里面只有一句“#include “../csu/errno-loc.c””虽然不知道csu目录是干嘛的,但是打开该文件。里面__errno_location()的定义是return &errno。这一下又绕回去了,那么这个errno到底在哪里定义的呢?在该文件中include了两个文件“errno.h和tls.h”。在glibc/include/errno.h中,看到如下定义“extern __thread int  attribute_tls_model_ie;”

所以小结一下,其实在多线程中errno的实现就是将通过__thread定义成一个tls变量。那么为什么不直接访问errno,而是使用__errno_location()函数呢,我认为这样是提供一个接口,可以不同实现机制,而应用程序中只需要调用__errno_location()获取errno。

3. 关于tls

这样errno就被编入tls段了。每创建一个线程那么就会从.tls段进行一次copy。那么究竟cpoy到哪个地址呢?线程肯定要记录这个地址,这样就对tls变量进行访问时就可以参照tls中的定义知道tls变量的类型和偏移+线程的tls内容copy的地址,就可以正确访问tls变量了。 linux内核使用struct thread_info结构体描述一个线程,里面的内容都是具体arch相关的,每个体系结构自定义。那么就可以在里面定义一个变量,用于指向该线程tls的地址。然后通过获取内核thread_info的该变量的值便可找到该线程tls的内容。

那应用程序怎样获取内核thread_info中的内容呢。不同的体系结构的实现机制可能不一样。举个例子可以使用一个特殊的异常指令来实现。应用程序通过执行该异常指令,触发该异常,在异常处理程序中(进入内核态)获取内核thread_info中记录的tls的地址。

4. 疑问

知道了errno是怎样实现的。回头想想我的errno不能print的问题。首先它是个单线程程序,不存在tls的问题。其次,之前是在64位系统中编译调试的,后来换了一台32位系统的机器,gdb是可以print errno的。32位机内核版本是2.6.31,64位机的内核版本是2.6.9 是内核版本的问题?or 64-bit os对内存管理不一样导致的。

0 0