第17章 程序管理与SELinux初探

来源:互联网 发布:动漫下载软件 编辑:程序博客网 时间:2024/05/21 17:58

基本概念

  1. 程序:通常为二进制程序放置在存储媒介中(如硬盘、光盘、软盘、磁带等),以物理文件的形式存在。
  2. 进程:程序被触发后,执行者的权限与属性、程序的程序代码与所需数据等都会加载到内存中,操作系统并给予这个内存内的单元一个标识符(PID),可以说,进程就是一个正在进行中的程序。
  3. 系统或网络服务:常驻在内存的进程。通常都是负责一些系统所提供的功能以服务用户各项任务,因此这些常驻进程就会被我们称为服务(daemon)。主要为系统本身所需要的服务和负责网络联机的服务。而网络服务被执行后,它会启动一个可以负责网络监听的端口,以提供外部客户端的链接请求。

工作管理

概述

这个工作管理是用在bash环境下的,也就是说:当我们登录系统取得bash shell 之后,在单一终端机下同时进行多个工作的行为管理。

  • 前台:你可以控制与执行命令的这个环境称为前台(foreground)的工作;
  • 后台:可以自行运行的工作,无法使用ctrl+c终止它,可使用bg/fg调用该工作;
  • 后台中执行的进程不能等待terminal/shell的输入(input)。即不能与用户互动,比如vim可以放在后台挂起,但绝对不能在后台里面执行。

前台与后台

直接将程序放在后台: &

[root@localhost ~]# tar -zpcf /temp/etc.tar.gz  /etc &

这样仍会有输出输入到屏幕

数据流重定向后放入后台运行

[root@localhost ~]# tar -zpcf /temp/etc.tar.gz  /etc  > /dev/null 2>&1 &[1]  8400   <==[job number] PID[root@localhost ~]# jobs[1]  + running    python rap_worker_post.py > /dev/null 2>&1

将当前的工作丢到后台中“暂停”:ctrl+z

[root@localhost ~]# vim ~/.bashrc#在vim的一般模式下,按下ctrl+z[1]+ Stopped     [root@localhost ~]# jobs[1]  - running    python rap_worker_post.py > /dev/null 2>&1[2]  + suspended  vim .bashr

查看目前的后台工作状态 :jobs -l

[root@localhost ~]# jobs -l[1]  - 55019 running    python rap_worker_post.py > /dev/null 2>&1[2]  + 55182 suspended  vim .bashrc

+:表示最近被放到后台的工作号码,也是fg命令默认取的工作
-:表示最近最后第二个被放置到后台中的工作号码。

将后台工作拿到前台来处理:fg

[root@localhost ~]# fg  <==默认取出+的工作[root@localhost ~]# fg %1  <==直接取规定的工作号码

让程序在后台运行:bg

[root@localhost ~]# find / -name elasticsearch#ctrl+z放到后台暂停[root@localhost ~]# jobs[1]    running    python rap_worker_post.py > /dev/null 2>&1[2]  - suspended  vim .bashrc[3]  + suspended  find / -name elasticsearch[root@localhost ~]# bg %3;jobs    <==将任务3在后台中运行,任务运行完后会自动从jobs中消失[1]    running    python rap_worker_post.py > /dev/null 2>&1[2]  + suspended  vim .bashrc[3]  - running    find / -name elasticsearch

终止后台任务:kill

kill -signal %jobnumber

-1: 重新读取一次参数的配置文件(类似reload);
-2:代表与由键盘输入ctrl+c同样的操作;
-9:立刻强制删除一个工作;
-15:以正常的程序方式终止一项工作。

[root@localhost ~]# kill -9 %1 <==杀掉工作1

-9与-15,两者不同。举例来说,在用vim的时候,会产生一个.filename.swap文件,使用-15会删除这个.filename.swap,但使用-9时,由于vim会被强制删除掉,因此.filename.swap会继续存在文件系统中。

另外,kill后面接的数字默认是PID,如果想要管理bahs的工作控制,要加上%数字。

脱机管理:nohup/setsid/&

场景:
如果只是临时有一个命令需要长时间运行,即脱离当前shell客户端后,仍可以保证它在后台稳定运行呢?
解决方法:
我们知道,当用户注销(logout)或者网络断开时,终端会收到 HUP(hangup)信号从而关闭其所有子进程。因此,我们的解决办法就有两种途径:要么让进程忽略 HUP 信号,要么让进程运行在新的会话里从而成为不属于此终端的子进程。

1、nohup

[root@localhost ~]# nohup ping www.baidu.com[1] 56648nohup: 忽略输入并把输出追加到"nohup.out"  [root@localhost ~]# jobs[1]  + running    nohup ping www.ibm.com[root@localhost ~]# ps -ef|grep ibmroot     56648 56577  0 16:34 pts/9    00:00:00 ping www.ibm.com

当断开当前shell客户端,重新连接后

[root@localhost ~]# jobs   <==此时执行jobs任务为空[root@localhost ~]# ps -ef|grep ibmroot     56648     1  0 16:34 ?        00:00:00 ping www.ibm.com   <==注意这里父进程变成了1

默认的标准输出和标准错误缺省会被重定向到当前目录的nohup.out文件中。一般我们可在结尾加上”&”来将命令同时放入后台运行,也可用> filename 2>&1 来更改缺省的重定向文件名。

[root@localhost ~]# nohup ping www.baidu.com > /dev/null 2>&1 &[root@localhost ~]# [1] 56140[root@localhost ~]# ps -ef |grep 56140root     56140 55516  0 16:13 pts/9    00:00:00 ping www.baidu.com

2、setsid

nohup 无疑能通过忽略 HUP 信号来使我们的进程避免中途被中断,但如果我们换个角度思考,如果我们的进程不属于接受 HUP 信号的终端的子进程,那么自然也就不会受到 HUP 信号的影响了。setsid 就能帮助我们做到这一点。让我们先来看一下 setsid 的帮助信息:

SETSID(8)                 Linux Programmer’s Manual                 SETSID(8)NAME       setsid - run a program in a new sessionSYNOPSIS       setsid program [ arg ... ]DESCRIPTION       setsid runs a program in a new session.

可见 setsid 的使用也是非常方便的,也只需在要处理的命令前加上 setsid 即可。

[root@pvcent107 ~]# setsid ping www.ibm.com > /dev/null 2>&1 &[root@pvcent107 ~]# ps -ef |grep www.ibm.comroot     31094     1  0 07:28 ?        00:00:00 ping www.ibm.comroot     31102 29217  0 07:29 pts/4    00:00:00 grep www.ibm.com[root@pvcent107 ~]#

值得注意的是,上例中我们的进程 ID(PID)为31094,而它的父 ID(PPID)为1(即为 init 进程 ID),并不是当前终端的进程 ID。请将此例与nohup 例中的父 ID 做比较。

&

这里还有一个关于 subshell 的小技巧。我们知道,将一个或多个命名包含在“()”中就能让这些命令在子 shell 中运行中,从而扩展出很多有趣的功能,我们现在要讨论的就是其中之一。

当我们将”&”也放入“()”内之后,我们就会发现所提交的作业并不在作业列表中,也就是说,是无法通过jobs来查看的。让我们来看看为什么这样就能躲过 HUP 信号的影响吧。

subshell 示例

[root@pvcent107 ~]# (ping www.ibm.com &)[root@pvcent107 ~]# ps -ef |grep www.ibm.comroot     16270     1  0 14:13 pts/4    00:00:00 ping www.ibm.comroot     16278 15362  0 14:13 pts/4    00:00:00 grep www.ibm.com[root@pvcent107 ~]#

从上例中可以看出,新提交的进程的父 ID(PPID)为1(init 进程的 PID),并不是当前终端的进程 ID。因此并不属于当前终端的子进程,从而也就不会受到当前终端的 HUP 信号的影响了

将当前进程改为脱机运行进程

disown

场景:
我们已经知道,如果事先在命令前加上 nohup 或者 setsid 就可以避免 HUP 信号的影响。但是如果我们未加任何处理就已经提交了命令,该如何补救才能让它避免 HUP 信号的影响呢?

解决方法:
这时想加 nohup 或者 setsid 已经为时已晚,只能通过作业调度和 disown 来解决这个问题了。让我们来看一下 disown 的帮助信息

disown [-ar] [-h] [jobspec ...]    Without options, each jobspec is  removed  from  the  table  of    active  jobs.   If  the -h option is given, each jobspec is not    removed from the table, but is marked so  that  SIGHUP  is  not    sent  to the job if the shell receives a SIGHUP.  If no jobspec    is present, and neither the -a nor the -r option  is  supplied,    the  current  job  is  used.  If no jobspec is supplied, the -a    option means to remove or mark all jobs; the -r option  without    a  jobspec  argument  restricts operation to running jobs.  The    return value is 0 unless a jobspec does  not  specify  a  valid    job.

可以看出,我们可以用如下方式来达成我们的目的。

  • 用disown -h jobspec来使某个作业忽略HUP信号。
  • 用disown -ah 来使所有的作业都忽略HUP信号。
  • 用disown -rh 来使正在运行的作业忽略HUP信号。

ctrl-z 的用途就是将当前进程挂起(Suspend),然后我们就可以用jobs命令来查询它的作业号,再用bg jobspec来将它放入后台并继续运行。需要注意的是,如果挂起会影响当前进程的运行结果,请慎用此方法。

disown 示例1(如果提交命令时已经用“&”将命令放入后台运行,则可以直接使用“disown”)

[root@pvcent107 build]# cp -r testLargeFile largeFile &[1] 4825[root@pvcent107 build]# jobs[1]+  Running                 cp -i -r testLargeFile largeFile &[root@pvcent107 build]# disown -h %1[root@pvcent107 build]# ps -ef |grep largeFileroot      4825   968  1 09:46 pts/4    00:00:00 cp -i -r testLargeFile largeFileroot      4853   968  0 09:46 pts/4    00:00:00 grep largeFile[root@pvcent107 build]# logout

disown 示例2(如果提交命令时未使用“&”将命令放入后台运行,可使用 CTRL-z 和“bg”将其放入后台,再使用“disown”)

[root@pvcent107 build]# cp -r testLargeFile largeFile2[1]+  Stopped                 cp -i -r testLargeFile largeFile2[root@pvcent107 build]# bg %1[1]+ cp -i -r testLargeFile largeFile2 &[root@pvcent107 build]# jobs[1]+  Running                 cp -i -r testLargeFile largeFile2 &[root@pvcent107 build]# disown -h %1[root@pvcent107 build]# ps -ef |grep largeFile2root      5790  5577  1 10:04 pts/3    00:00:00 cp -i -r testLargeFile largeFile2root      5824  5577  0 10:05 pts/3    00:00:00 grep largeFile2[root@pvcent107 build]#

screen

场景:
我们已经知道了如何让进程免受 HUP 信号的影响,但是如果有大量这种命令需要在稳定的后台里运行,如何避免对每条命令都做这样的操作呢?

解决方法:

此时最方便的方法就是 screen 了。简单的说,screen 提供了 ANSI/VT100 的终端模拟器,使它能够在一个真实终端下运行多个全屏的伪终端。screen 的参数很多,具有很强大的功能,我们在此仅介绍其常用功能以及简要分析一下为什么使用 screen 能够避免 HUP 信号的影响。我们先看一下 screen 的帮助信息:

SCREEN(1)                                                           SCREEN(1)NAME       screen - screen manager with VT100/ANSI terminal emulationSYNOPSIS       screen [ -options ] [ cmd [ args ] ]       screen -r [[pid.]tty[.host]]       screen -r sessionowner/[[pid.]tty[.host]]DESCRIPTION       Screen  is  a  full-screen  window manager that multiplexes a physical       terminal between several  processes  (typically  interactive  shells).       Each  virtual  terminal provides the functions of a DEC VT100 terminal       and, in addition, several control functions from the  ISO  6429  (ECMA       48,  ANSI  X3.64)  and ISO 2022 standards (e.g. insert/delete line and       support for multiple character sets).  There is a  scrollback  history       buffer  for  each virtual terminal and a copy-and-paste mechanism that       allows moving text regions between windows.

使用 screen 很方便,有以下几个常用选项:

  • 用screen -dmS session name来建立一个处于断开模式下的会话(并指定其会话名)。
  • 用screen -list 来列出所有会话。
  • 用screen -r session name来重新连接指定会话。

screen 示例

[root@pvcent107 ~]# screen -dmS Urumchi[root@pvcent107 ~]# screen -listThere is a screen on:        12842.Urumchi   (Detached)1 Socket in /tmp/screens/S-root.[root@pvcent107 ~]# screen -r Urumchi

当我们用“-r”连接到 screen 会话后,我们就可以在这个伪终端里面为所欲为,再也不用担心 HUP 信号会对我们的进程造成影响,也不用给每个命令前都加上“nohup”或者“setsid”了。这是为什么呢?让我来看一下下面两个例子吧。

1. 未使用 screen 时新进程的进程树

[root@pvcent107 ~]# ping www.google.com &[1] 9499[root@pvcent107 ~]# pstree -H 9499init─┬─Xvnc     ├─acpid     ├─atd     ├─2*[sendmail]      ├─sshd─┬─sshd───bash───pstree     │       └─sshd───bash───ping

2. 使用了 screen 后新进程的进程树

[root@pvcent107 ~]# screen -r Urumchi[root@pvcent107 ~]# ping www.ibm.com &[1] 9488[root@pvcent107 ~]# pstree -H 9488init─┬─Xvnc     ├─acpid     ├─atd     ├─screen───bash───ping     ├─2*[sendmail]

而使用了 screen 后就不同了,此时 bash 是 screen 的子进程,而 screen 是 init(PID为1)的子进程。那么当 ssh 断开连接时,HUP 信号自然不会影响到 screen 下面的子进程了。

总结

现在几种方法已经介绍完毕,我们可以根据不同的场景来选择不同的方案。nohup/setsid 无疑是临时需要时最方便的方法,disown 能帮助我们来事后补救当前已经在运行了的作业,而 screen 则是在大批量操作时不二的选择了。

进程管理

PS:查看某个时间点的进程

查看自己操作环境(bash)的相关进程

[root@pvcent107 ~]# ps -lF S   UID   PID  PPID  C PRI  NI ADDR SZ WCHAN  TTY          TIME CMD4 S     0 30581 30579  4  80   0 - 35931 sigsus pts/0    00:00:00 zsh0 R     0 30620 30581  0  80   0 - 30319 -      pts/0    00:00:00 ps//具体的详细参数F,S,UID,PID.....请自行google,或参考鸟哥私房菜基础篇第三版P516.[root@pvcent107 ~]# ps -lA  <==大写的A,显示系统所有进程。与ps aux一样,但显示的条目标题不同

查看所有系统运行的进程

[root@pvcent107 ~]# ps aux          <==注意这里没有-USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMANDroot         1  0.0  0.0  54340  4132 ?        Ss   522   0:11 /usr/lib/systemd/systemd --switched-root --system --deserialize 23root         2  0.0  0.0      0     0 ?        S    522   0:00 [kthreadd]root         3  0.0  0.0      0     0 ?        S    522   0:00 [ksoftirqd/0]....//具体参数参考P517页。

找出与crom与syslog服务有关的PID

[root@pvcent107 ~]# ps aux|egrep '(cron|syslog)'

僵尸进程

成因:通常,造成僵尸进程的成因是因为该进程应该已经执行完毕,或者是因故应该要终止了,但是该进程的父进程却无法完整将该进程结束掉,而造成那个进程一直存在内存当中。

查看:当执行ps查看进程时,若进程后面有 < defunct>,就代表该进程时僵尸进程。

比如:

root     29570  4486  0 16:39 ?        00:00:00 [python] <defunct>

top:动态查看进程的变化

显示内容解析

[root@TG1704 log]# toptop - 14:06:23 up 70 days, 16:44,  2 users,  load average: 1.25, 1.32, 1.35Tasks: 206 total,   1 running, 205 sleeping,   0 stopped,   0 zombieCpu(s):  5.9%us,  3.4%sy,  0.0%ni, 90.4%id,  0.0%wa,  0.0%hi,  0.2%si,  0.0%stMem:  32949016k total, 14411180k used, 18537836k free,   169884k buffersSwap: 32764556k total,        0k used, 32764556k free,  3612636k cached  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                                28894 root      22   0 1501m 405m  10m S 52.2  1.3   2534:16 java                                                                   18249 root      18   0 3201m 1.9g  11m S 35.9  6.0 569:39.41 java 

统计信息区:

前五行是当前系统情况整体的统计信息区。下面我们看每一行信息的具体意义。

第一行,任务队列信息,同 uptime 命令的执行结果,具体参数说明情况如下:

14:06:23 — 当前系统时间

up 70 days, 16:44 — 系统已经运行了70天16小时44分钟(在这期间系统没有重启过的吆!)

2 users — 当前有2个用户登录系统

load average: 1.15, 1.42, 1.44 — load average后面的三个数分别是1分钟、5分钟、15分钟的负载情况。

load average数据是每隔5秒钟检查一次活跃的进程数,然后按特定算法计算出的数值。如果这个数除以逻辑CPU的数量,结果高于5的时候就表明系统在超负荷运转了。

第二行, Tasks — 任务(进程),具体信息说明如下:
系统现在共有206个进程,其中处于运行中的有1个,205个在休眠(sleep),stoped状态的有0个,zombie状态(僵尸)的有0个。

第三行,cpu状态信息,具体属性说明如下:

5.9%us — 用户空间占用CPU的百分比。

3.4% sy — 内核空间占用CPU的百分比。

0.0% ni — 改变过优先级的进程占用CPU的百分比

90.4% id — 空闲CPU百分比

0.0% wa — IO等待占用CPU的百分比

0.0% hi — 硬中断(Hardware IRQ)占用CPU的百分比

0.2% si — 软中断(Software Interrupts)占用CPU的百分比

备注:在这里CPU的使用比率和windows概念不同,需要理解linux系统用户空间和内核空间的相关知识!

第四行,内存状态,具体信息如下:
32949016k total — 物理内存总量(32GB)

14411180k used — 使用中的内存总量(14GB)

18537836k free — 空闲内存总量(18GB)

169884k buffers — 缓存的内存量 (169M)

第五行,swap交换分区信息,具体信息说明如下:

32764556k total — 交换区总量(32GB)

0k used — 使用的交换区总量(0K)

32764556k free — 空闲交换区总量(32GB)

3612636k cached — 缓冲的交换区总量(3.6GB)

将top信息进行2次,输出到文本

[root@TG1704 log]# top -b -n 2 > /temp/top.txt/* -d :  进程界面更新的秒数,默认是5 -b :  以批次的方式执行top —n :  与-b搭配,意义是,需要进行几次top的输出结果。 -p :  指定某个PID来进行检测

交互命令

 ?: 显示在top中可以输入的按键命令 P: 以CPU的使用资源排序显示 M: 以内存的使用资源排序显示 N: 以PID来排序 T: 由该进程使用的cpu时间累积排序 k: 给予某个PID一个信号 r: 给予某个重新指定一个nice值 q: 离开top

1.多U多核CPU监控
在top基本视图中,按键盘数字“1”,可监控每个逻辑CPU的状况:

2.进程字段排序

输入M(大写),按内存占用率排序

输入P(大写),按cpu利用率排序

x(小写):高亮排序的字段。

3,q,退出top

pstree,查看进程树

进程优先级

[root@TG1704 log]# ps -lF S   UID   PID  PPID  C PRI  NI ADDR SZ WCHAN  TTY          TIME CMD4 S     0 30581 30579  0  80   0 - 35931 sigsus pts/0    00:00:00 zsh0 R     0 32362 30581  0  80   0 - 30319 -      pts/0    00:00:00 ps

PRI表示进程优先级,PRI值越低代表优先级越大,PRI由内核动态调整的,用户无法直接调整PRI。但可以设置Nice值

PRI(new) = PRI(old)+nice

nice值的范围是-20~19

所以当nice为负值时,该程序就会降低PRI值。

使用

//在命令前加nice[root@TG1704 log]# nice -n -5 vim temp.txt & [root@TG1704 log]# renice [number] PID

系统资源的查看

free:查看内存使用情况

uname -a:查看系统内核信息

uptime:查看系统启动时间与工作负载

netstat:跟踪网络

dmesg:输出所有的内核开机信息

vmstat:检测系统资源变化

0 0