使用Shell来监控linux系统和进程(1)

来源:互联网 发布:网络咸鱼是什么意思 编辑:程序博客网 时间:2024/06/07 10:17

hell语言对于接触Linux的人来说都比较熟悉,它是系统的用户界面,提供了用户与内核进行交互操作的一种接口。它接收用户输入的命令并把它送入内核去执行。实际上Shell是一个命令解释器,它解释由用户输入的命令并且把它们送到内核。它没有一般编程语言的“编译 - 链接 - 运行”过程。不仅如此,Shell有自己的编程语言用于对命令的编辑,它允许用户编写由shell命令组成的程序。Shell编程语言具有普通编程语言的很多特点,比如它也有循环结构和分支控制结构等,用这种编程语言编写的Shell程序与其他应用程序具有同样的效果。当然,Shell功能也是很强大的。Shell有多种类型,其中最常用的几种是Bourne shell(sh)、C shell(csh)和 Korn shell(ksh)三种。shell各有优缺点,Linux操作系统缺省的shell一般是Bourne Again shell,它是Bourne shell的扩展,简称Bash。Bash的命令语法是Bourne shell命令语法的超集,并且在Bourne shell的基础上增加、增强了很多特性。在这里,我们以Bash做为实例总结了使用Shell对系统和进程资源进行监控的一些内容,希望对您能有帮助。 

检查进程是否存在

在对进程进行监控时,我们一般需要得到该进程的ID,进程ID是进程的唯一标识,但是有时可能在服务器上不同用户下运行着多个相同进程名的进程,下面的函数GetPID给出了获取指定用户下指定进程名的进程ID功能(目前只考虑这个用户下启动一个此进程名的进程),它有两个参数为用户名和进程名,它首先使用ps查找进程信息,同时通过grep过滤出需要的进程,最后通过sed和awk查找需要进程的ID值(此函数可根据实际情况修改,比如需要过滤其它信息等)。

清单1.对进程进行监控

  1. function GetPID #User #Name  
  2.  
  3. {  
  4.  
  5. PsUser=$1  
  6.  
  7. PsName=$2  
  8.  
  9. pid=`ps -u $PsUser|grep $PsName|grep -v grep|grep -v vi|grep -v dbx\n  
  10.  
  11. |grep -v tail|grep -v start|grep -v stop |sed -n 1p |awk '{print $1}'`  
  12.  
  13. echo $pid  
  14.  
  15. }  
  16.  

示例演示:

1)源程序(例如查找用户为root,进程名为CFTestApp的进程 ID)

  1. PID=`GetPID root CFTestApp`  
  2.  
  3. echo $PID 

2)结果输出

  1. 11426  
  2.  
  3. [dyu@xilinuxbldsrv shell]$ 

3)结果分析

从上面的输出可见:11426为root用户下的CFTestApp程序的进程ID。

4)命令介绍

1.ps:查看系统中瞬间进程信息。

参数:-u<用户识别码>列出属于该用户的程序的状况,也可使用用户名称来指定。

-p<进程识别码>指定进程识别码,并列出该进程的状况。

-o指定输出格式

2.grep:用于查找文件中符合字符串的当前行。

参数:-v反向选择,亦即显示出没有‘搜寻字符串’内容的那一行。

3.sed:一个非交互性文本编辑器,它编辑文件或标准输入导出的文件,一次只能处理一行内容。

参数:-n读取下一个输入行,用下一个命令处理新的行而不是用第一个命令。

p标志打印匹配行

4.awk:一种编程语言,用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件,或其它命令的输出。它支持用户自

定义函数和动态正则表达式等先进功能,是linux/unix下的一个强大编程工具。它在命令行中使用,但更多是作为脚本来使用。awk的处理文本和数据的方式:它逐行扫描文件,从第一行到最后一行,寻找匹配的特定模式的行,并在这些行上进行你想要的操作。如果没有指定处理动作,则把匹配的行显示到标准输出(屏幕),如果没有指定模式,则所有被操作所指定的行都被处理。

参数:-F fs or –field-separator fs:指定输入文件折分隔符,fs是一个字符串或者是一个正则表达式,如-F:。

有时有可能进程没有启动,下面的功能是检查进程ID是否存在,如果此进程没有运行输出:

  1. The process does not exist.  
  2. # 检查进程是否存在  
  3. if [ "-$PID" == "-" ]  
  4. then  
  5. {  
  6. echo "The process does not exist."  
  7. }  
  8. fi 

检测进程CPU利用率

在对应用服务进行维护时,我们经常遇到由于CPU过高导致业务阻塞,造成业务中断的情况。CPU过高可能由于业务量过负荷或者出现死循环等异常情况,通过脚本对业务进程CPU进行时时监控,可以在CPU利用率异常时及时通知维护人员,便于维护人员及时分析,定位,以及避免业务中断等。下面的函数可获得指定进程ID的进程CPU利用率。它有一个参数为进程ID,它首先使用ps查找进程信息,同时通过grep -v过滤掉%CPU行,最后通过awk查找CPU利用百分比的整数部分(如果系统中有多个CPU,CPU利用率可以超过100%)。

清单2.对业务进程CPU进行实时监控

  1. function GetCpu  
  2.  
  3. {  
  4.  
  5. CpuValue=`ps -p $1 -o pcpu |grep -v CPU | awk '{print $1}' | awk - F. '{print $1}'`  
  6.  
  7. echo $CpuValue  
  8.  

下面的功能是通过上面的函数GetCpu获得此进程的CPU利用率,然后通过条件语句判断CPU利用率是否超过限制,如果超过80%(可以根据实际情况进行调整),则输出告警,否则输出正常信息。

清单3.判断CPU利用率是否超过限制

  1. function CheckCpu  
  2.  
  3. {  
  4.  
  5. PID=$1  
  6.  
  7. cpu=`GetCpu $PID`  
  8.  
  9. if [ $cpu -gt 80 ]  
  10.  
  11. then  
  12.  
  13. {  
  14.  
  15. echo “The usage of cpu is larger than 80%”  
  16.  
  17. }  
  18.  
  19. else  
  20.  
  21. {  
  22.  
  23. echo “The usage of cpu is normal”  
  24.  
  25. }  
  26.  
  27. fi  
  28.  

示例演示:

1)源程序(假设上面已经查询出CFTestApp的进程ID为11426)

  1. CheckCpu 11426 

2)结果输出

  1. The usage of cpu is 75  
  2.  
  3. The usage of cpu is normal  
  4.  
  5. [dyu@xilinuxbldsrv shell]$ 

3)结果分析

从上面的输出可见:CFTestApp程序当前的CPU使用为75%,是正常的,没有超过80%的告警限制。

0 0
原创粉丝点击