关闭终端后,后台作业退出的分析

来源:互联网 发布:mac 退出当前程序 编辑:程序博客网 时间:2024/05/16 01:04

By fireworks2@foxmail.com

 

其实三两步就可以搞定的,但是因为纠结于到底是谁发出的SIGHUP,耗费了不少时间。


先把结论写在上面:

-- 内核驱动发现终端(或伪终端)关闭,给对应终端的控制进程(bash)发 SIGHUP 
-- bash收到SIGHUP后,会给各个作业(包括前后台)发送SIGHUP,然后自己退出
-- 前后台的各个任务,收到来自 bash 的SIGHUP,退出(如果程序会处理SIGHUP,就不会退出)

 

PS: 这里所谓终端关闭就是指内核感知不到终端了,远程登录时的网络断开、sshd挂掉之类的情况也算在内。

PPS: SIGHUP会在以下情况发出

1、终端关闭时,该信号被内核发送到session首进程

2、session首进程退出时,该信号被内核发送到该session中的前台进程组中的每一个进程

3、若父进程退出导致进程组成为孤儿进程组,且该进程组中有进程处于停止状态(收到SIGSTOP或SIGTSTP信号),该信号会被发送到该进程组中的每一个进程。

PPPS: bash 收到SIGHUP后会转发给各个任务(job)

 




 

 


下面是”纠结“的分析过程:


现象:./a.out & 这种方式运行,关闭终端后,a.out也会终止


分析:

首先,写了个简单的脚本看是什么信号导致的后台作业退出。

a.pl:

#! /usr/bin/perl -w


$SIG{HUP} = sub{print "HUP/n"};

$SIG{KILL} = sub{print "KILL/n"};

$SIG{TERM} = sub{print "TERM/n"};


while (1){

    sleep 1;

}


运行a.pl: ./a.pl > log.txt &;关闭终端;在另一个终端查看log.txt,内容为HUP,且a.pl仍然存活

结论:是SIGHUP信号导致后台作业退出


然后,查看SIGHUP从哪里来,google + baidu,搜索到最多的那个(就是来回转载的,中文技术资料的冗余程度,你懂的!)

SIGHUP会在以下3种情况下被发送给相应的进程:

1、终端关闭时,该信号被发送到session首进程以及作为job提交的进程(即用 & 符号提交的进程)

2、session首进程退出时,该信号被发送到该session中的前台进程组中的每一个进程

3、若父进程退出导致进程组成为孤儿进程组,且该进程组中有进程处于停止状态(收到SIGSTOP或SIGTSTP信号),该信号会被发送到该进程组中的每一个进程。


       到这一步,仿佛已经很明了,终端或者伪终端关闭后,SIGHUP会发给“作为job提交的进程”。

       然而我恰好犯贱,想多浪费一些时间,又翻看了一下《Unix环境高级编程》,发现其实上面标粉红的那一部分貌似是主观意见而已。但是作为job提交的 a.pl 确实收到了一个SIGHUP,是谁在什么情形下偷偷发出的呢?

       于是上CSND求牛人作答:http://topic.csdn.net/u/20110402/23/0eebdafa-c2c1-4ed5-b981-365f80bb6e7f.html

       鉴于回答热度不高,无奈又上stackoverflow问了一下:http://stackoverflow.com/questions/5527405/where-is-sighup-from-sshd-forks-a-child-to-create-a-new-session-kill-this-chil

       stackoverflow上的回答还算有些靠谱,自己仿佛觉得,mm,这个SIGHUP来自内核的driver。


继续验证 a.pl 收到的确来自内核driver,而不是相干的进程(如父进程bash)

又去查看bash的手册,终于看到

The shell exits by default upon receipt of a SIGHUP. Before exiting, an interactive shell resends the SIGHUP to all jobs, running or stopped. Stopped jobs are sent SIGCONT to ensure that they receive the SIGHUP.

 

真相接近大白:原来是bash在收到内核driver发出的SIGHUP后,转发给 a.pl 的 !

 

欣喜之余,跑到csdn自己提问的那个链接匆忙结贴。


 


 

 

待续:

使用trap命令,运行

i=-1;while((++i<33)); do trap "echo $i >> log.txt" $i; done

强行关闭终端,log.txt的内容为

1
18
1
17
0

bash竟然收到这么多信号... 还是我trap用的有问题,为什么bash会收到这些信号呢?

 

http://topic.csdn.net/u/20110405/09/8f20f0dc-492a-4c3b-bd36-eb8c6f9ff482.html