ssh nohup 和 &

来源:互联网 发布:sql update 编辑:程序博客网 时间:2024/06/05 03:58

ssh nohup 和 &

你是不是经常需要 SSH 或者 telent 远程登录到 Linux 服务器?你是不是经常为一些长时间运行的任务而头疼,比如系统备份、ftp 传输等等。通常情况下我们都是为每一个这样的任务开一个远程终端窗口,因为他们执行的时间太长了。必须等待它执行完毕,在此期间可不能关掉窗口或者断开连接,否则这个任务就会被杀掉,一切半途而废了。

元凶:SIGHUP 信号

让我们来看看为什么关掉窗口/断开连接会使得正在运行的程序死掉。

在Linux/Unix中,有这样几个概念:

  • 进程组(process group):一个或多个进程的集合,每一个进程组有唯一一个进程组ID,即进程组长进程的ID。
  • 会话期(session):一个或多个进程组的集合,有唯一一个会话期首进程(session leader)。会话期ID为首进程的ID。
  • 会话期可以有一个单独的控制终端(controlling terminal)。与控制终端连接的会话期首进程叫做控制进程(controlling process)。当前与终端交互的进程称为前台进程组。其余进程组称为后台进程组。

根据POSIX.1定义:

  • 挂断信号(SIGHUP)默认的动作是终止程序。
  • 当终端接口检测到网络连接断开,将挂断信号发送给控制进程(会话期首进程)。
  • 如果会话期首进程终止,则该信号发送到该会话期前台进程组。
  • 一个进程退出导致一个孤儿进程组中产生时,如果任意一个孤儿进程组进程处于STOP状态,发送SIGHUP和SIGCONT信号到该进程组中所有进程。

因此当网络断开或终端窗口关闭后,控制进程收到SIGHUP信号退出,会导致该会话期内其他进程退出。

我们来看一个例子。打开两个SSH终端窗口,在其中一个运行top命令。

[root@tivf09 root]# top

在另一个终端窗口,找到top的进程ID为5180,其父进程ID为5128,即登录shell。

[root@tivf09 root]# ps -ef|grep toproot      5180  5128  0 01:03 pts/0    00:00:02 toproot      5857  3672  0 01:12 pts/2    00:00:00 grep top

使用pstree命令可以更清楚地看到这个关系:

[root@tivf09 root]# pstree -H 5180|grep top|-sshd-+-sshd---bash---top            

使用ps-xj命令可以看到,登录shell(PID 5128)和top在同一个会话期,shell为会话期首进程,所在进程组PGID为5128,top所在进程组PGID为5180,为前台进程组。

[root@tivf09 root]# ps -xj|grep 5128 5126  5128  5128  5128 pts/0     5180 S        0   0:00 -bash 5128  5180  5180  5128 pts/0     5180 S        0   0:50 top 3672 18095 18094  3672 pts/2    18094 S        0   0:00 grep 5128

关闭第一个SSH窗口,在另一个窗口中可以看到top也被杀掉了。

[root@tivf09 root]# ps -ef|grep 5128root     18699  3672  0 04:35 pts/2    00:00:00 grep 5128

如果我们可以忽略SIGHUP信号,关掉窗口应该就不会影响程序的运行了。nohup命令可以达到这个目的,如果程序的标准输出/标准错误是终端,nohup默认将其重定向到nohup.out文件。值得注意的是nohup命令只是使得程序忽略SIGHUP信号,还需要使用标记&把它放在后台运行。


测试一下:

Local ->A->B

从Local ssh到A,然后再从A ssh到B, 在B上执行命令,如下

shell的死循环:while true;do echo "nohup";done 把这个程序写到loop.sh文件里。

不通过nohup执行的命令./loop.sh,用top命令在B上查看有loop.sh;然后再开启一个终端,从local ssh 进入A,在A上把从local ssh过来的进程kill掉。此时,在B上的top看到的loop.sh消失了。

通过nohup执行命令loop.sh: 在通过A ssh到的B上,执行:nohup ./loop.sh &,用top命令查看有loop.sh,然后再开启一个终端,从local ssh 进入A,在A上把从local ssh过来的进程kill掉。此时,在B上的top看到的loop.sh还继续存在。

工作中用到的tmux和vnc,主机都在远端server上,切断本地和server之间的连接之后,再次登录还能还原最后一次登录时的session,并没有因为ssh的断开而终止。tmux和vnc也都ignore hang up 这个信号了。


nohup <command> [argument…] &
0 0
原创粉丝点击