linux SIGSEGV 信号捕捉，保证发生段错误后程序不崩溃

来源：互联网发布：弱智吧知乎编辑：程序博客网时间：2024/05/21 11:16

在linux中编程的时候有时候 try catch 可能满足不了我们的需求。因为碰到类似数组越界，非法内存访问之类的，这样的错误无法捕获。下面我们介绍一种使用捕获信号实现的异常用来保证诸如段错误之类的错误发生时程序不会崩溃，而是跳过代码继续执行。首先我们来看看发生段错误之后系统的处理。

发生段错误后系统会抛出 SIGSEGV 信号，之后调用默认的信号处理函数，产生core文件，然后关闭程序。

那有没有一种办法可以保证程序不会死掉呢，当然是有的。首先我们想到的是截获改信号，调用自己的信号处理函数。

让我们来看看signal 这个函数。

#include <signal.h>

typedef void (*sighandler_t)(int);

sighandler_t signal(int signum, sighandler_t handler);

第一个参数的意思表示你要绑定的信号（可以使用在控制台使用 kill -l 查看都有哪些信号，这些就不讲了，有兴趣的可以上网查）

第二个参数是表示信号处理的函数指针，返回值为void* 参数为int ，如上，另外系统也定义了一些宏

（SIG_IGN，和 SIG_DFL）第一个表示忽略这个信号，第二个表示使用默认的信号处理函数如果我们处理的是SIGSEGV信号，那么它就会产生core文件等等操作

返回值是一个信号处理函数的指针，如果发生错误返回 SIG_ERR 这个宏，事实上也是定义的一个函数产生错误的原因主要是因为给定的信号不正确

另外这个使用函数有两点要注意

1. 进入到信号处理函数之后这个信号会被阻塞（block）直到信号处理函数返回这点非常重要，后面会讲到。

2. 信号函数处理完之后，会将该信号恢复为默认处理状态，即重新与产生core文件...函数绑定，所以在下一次用到的时候要重新调用signal这个函数绑定

自定义的信号处理函数

那么我们就可以开始尝试使用它了

#include <signal.h>#include <setjmp.h>#include <stdarg.h>#include <stdlib.h>#include <stdio.h>//信号处理函数void recvSignal(int sig){printf("received signal %d !!!\n",sig);}int main(int argc,char** argv){  //给信号注册一个处理函数   signal(SIGSEGV, recvSignal);  int* s = 0;  (*s) = 1; //以上两句用来产生 一个 传说中的段错误  while(1)  {    sleep(1);    printf("sleep 1 \n");  }  return 0;}

编译运行一直打印收到信号 11 （SIGSEGV），为什么呢，

上面代码给SIGSEGV 这个信号注册了一个处理函数，替代了系统默认的产生core文件的处理函数，当错误发生后，系统发送 SIGSEGV ，然后中断了程序跳到 recvSignal 处理函数中去，处理完成后，再跳回来错误发生的地方，然后继续产生错误，继续发送 SIGSEGV 信号 ...

使用 setjmp 和longjmp 尝试跳过错误堆栈

#include <setjmp.h>

int setjmp(jmp_buf env); void longjmp(jmp_buf env, int val);

系统跳转函数，可以直接在函数之间跳转（比goto 强大多了）

int setjmp(jmp_buf env); 这个函数将上下文，就是cpu和内存的信息保存到env中（不用去理解 jmp_buf，就当我们平时用的buff好了），然后调用 void longjmp(jmp_buf env, int val); 的时候跳转到使用env中的信息，恢复上下文。如果是第一回调用setjmp 它会返回 0，如果是在从longjmp 跳转过来的，那就返回 longjmp的参数 val，根据setjmp的返回值我们就可以决定执行可能发生错误的代码还是直接跳过这段代码。知道了原理之后我们可能就会这样写

#include <signal.h>#include <setjmp.h>#include <stdarg.h>#include <stdlib.h>#include <stdio.h>jmp_buf env;//信号处理函数void recvSignal(int sig){printf("received signal %d !!!\n",sig);        longjmp(env,1);}int main(int argc,char** argv){    //保存一下上下文     int r = setjmp(env);    if(  r  == 0)    {        //初次执行 ，那么可以执行 可能会发生错误的代码        //给信号注册一个处理函数          signal(SIGSEGV, recvSignal);        printf("excute this code!!");           int* s = 0;            (*s) = 1;    }    else    {        //是由longjmp 跳转回来的            printf("jump this code !!");     }    while(1)    {        sleep(1);        printf("sleep 1 \n");    }    return 0;}

编译，执行产生 SIGSEGV 信号，然后在信号函数里边跳转到 int r = setjmp(env); 这一行，之后直接略过了可能发生错误的这段代码 ,跳转生效，可是这种方式还有一个bug，我们看看下面的代码

#include <signal.h>#include <setjmp.h>#include <stdarg.h>#include <stdlib.h>#include <stdio.h>jmp_buf env;//信号处理函数void recvSignal(int sig){printf("received signal %d !!!\n",sig);        longjmp(env,1);}int main(int argc,char** argv){    for(int i = 0; i < 2; i++)    {            //保存一下上下文         int r = setjmp(env);        if(  r  == 0)        {            //初次执行 ，那么可以执行 可能会发生错误的代码            //给信号注册一个处理函数              signal(SIGSEGV, recvSignal);            printf("excute this code!!");               int* s = 0;                (*s) = 1;        }        else        {                //是由longjmp 跳转回来的                printf("jump this code !!");         }        sleep(5);    }    while(1)    {        sleep(1);        printf("sleep 1 \n");    }    return 0;}

当for循环第二次执行的时候，程序依然产生了 SIGSEGV，系统仍然调用了默认的处理函数产生了core文件，分析下原因上面我们说过“进入到信号处理函数之后这个信号会被阻塞（block）直到信号处理函数返回”，在进入到信号处理函数之后，这个时候系统阻塞了 SIGSEGV 这个信号，当跳回到 int r = setjmp(env); 这行代码的时候 SIGSEGV 信号依然是阻塞的，那以后再给他绑定信号处理函数自然没有作用。

好在系统给我们提供了int sigsetjmp(sigjmp_buf env, int savesigs);和 void siglongjmp(sigjmp_buf env, int val);这两个函数，这两个函数和上面的 int setjmp(jmp_buf env); void longjmp(jmp_buf env, int val); 大同小异，唯一的不同是sigsetjmp 函数多了一个参数，savesigs，查看这函数的说明可以知道，当 savesigs 不为 0时，会保存当前的信号屏蔽表 (signal mask)，然后在使用siglongjmp 跳转的时候会恢复线程的屏蔽表。

于是我们把上面的代码修改后如下：

#include <signal.h>#include <setjmp.h>#include <stdarg.h>#include <stdlib.h>#include <stdio.h>// jmp_buf env;//信号处理函数void recvSignal(int sig){printf("received signal %d !!!\n",sig);        siglongjmp(env,1);}int main(int argc,char** argv){    for(int i = 0; i < 2; i++)    {            //保存一下上下文         int r = sigsetjmp(env,1);        if(  r  == 0)        {            //初次执行 ，那么可以执行 可能会发生错误的代码            //给信号注册一个处理函数              signal(SIGSEGV, recvSignal);            printf("excute this code!!");               int* s = 0;                (*s) = 1;        }        else        {                //是由longjmp 跳转回来的                printf("jump this code !!");         }        sleep(5);    }    while(1)    {        sleep(1);        printf("sleep 1 \n");    }    return 0;}

编译后运行。按照我们的需求第二次进入for循环时，发生段错误后程序不会死掉，而是会跳过这段代码了继续往下走。下面我做了一个简单的封装，在错误发生时，我打印出了错误信息，然后跳过错误的代码

/*** file name CException.h*/#ifndef _CEXCEPTION_H_#define _CEXCEPTION_H_#include <setjmp.h>#include <stdlib.h>#include <stdarg.h>#include <execinfo.h>#include <stdio.h>#include <signal.h>#include <iostream>#include <string.h>typedef struct Except_frame{    jmp_buf env;    int flag;    void clear()    {       flag = 0;       bzero(env,sizeof(env));    }    bool isDef()    {       return flag;    }    Except_frame()    {      clear();    }}Except_frame;extern Except_frame* except_stack;extern void errorDump();extern void recvSignal(int sig);Except_frame* except_stack = new Except_frame;void errorDump(){    const int maxLevel = 200;    void* buffer[maxLevel];    int level = backtrace(buffer, maxLevel);    const int SIZE_T = 1024;    char cmd[SIZE_T] = "addr2line -C -f -e ";    char* prog = cmd + strlen(cmd);    readlink("/proc/self/exe", prog, sizeof(cmd) - (prog-cmd)-1);    FILE* fp = popen(cmd, "w");    if (!fp)    {        perror("popen");        return;    }    for (int i = 0; i < level; ++i)    {        fprintf(fp, "%p\n", buffer[i]);    }    fclose(fp);}void recvSignal(int sig){    printf("received signal %d !!!\n",sig);    errorDump();    siglongjmp(except_stack->env,1);}#define TRY \    except_stack->flag = sigsetjmp(except_stack->env,1);\    if(!except_stack->isDef()) \    { \      signal(SIGSEGV,recvSignal); \      printf("start use TRY\n");#define END_TRY \    }\    else\    {\      except_stack->clear();\    }\    printf("stop use TRY\n");#define RETURN_NULL \    } \    else \    { \      except_stack->clear();\    }\    return NULL;#define RETURN_PARAM  { \      except_stack->clear();\    }\    return x;#define EXIT_ZERO \    }\    else \    { \      except_stack->clear();\    }\    exit(0);#endif

另外建一个文件，

#include "CException.h"int main(int argc,char** argv){    //可以如下使用     TRY        int*s = 0;        (int*s) = 1;    END_TRY    //使用这两个宏包含可能发生的错误代码 ，当然可以根据需求 使用     //RETURN_NULL     //RETURN_PARAM(0)    //EXIT_ZERO  这三个宏    return 0;}

这个时候我们就能使用TRY 和 END_TRY,RETURM_NULL,RETURN_PARAM(param) 来实现程序发生段错误后跳过错误代码继续运行了，不过此代码仅限于单线程使用

弱智吧知乎

原创粉丝点击