Linux 系统性能分析工具2

来源:互联网 发布:开源b2c商城系统源码 编辑:程序博客网 时间:2024/04/30 00:50

3)使用sar进行综合分析

  表1 sar参数说明

  选项 功能

  -A 汇总所有的报告

  -a 报告文件读写使用情况

  -B 报告附加的缓存的使用情况

  -b 报告缓存的使用情况

  -c 报告系统调用的使用情况

  -d 报告磁盘的使用情况

  -g 报告串口的使用情况

  -h 报告关于buffer使用的统计数据

  -m 报告IPC消息队列和信号量的使用情况

  -n 报告命名cache的使用情况

  -p 报告调页活动的使用情况

  -q 报告运行队列和交换队列的平均长度

  -R 报告进程的活动情况

  -r 报告没有使用的内存页面和硬盘块

  -u 报告CPU的利用率

  -v 报告进程、i节点、文件和锁表状态

  -w 报告系统交换活动状况

  -y 报告TTY设备活动状况

 

   sar是System Activity Reporter(系统活动情况报告)的缩写。顾名思义,sar工具将对系统当前的状态进行取样,然后通过计算数据和比例来表达系统的当前运行状态。它的 特点是可以连续对系统取样,获得大量的取样数据;取样数据和分析的结果都可以存入文件,所需的负载很小。sar是目前Linux上最为全面的系统性能分析 工具之一,可以从14个大方面对系统的活动进行报告,包括文件的读写情况、系统调用的使用情况、串口、CPU效率、内存使用状况、进程活动及IPC有关的 活动等,使用也是较为复杂。

  sar的语法如下: 
 程序代码

sar [-option] [-o file] t [n]


  它的含义是每隔t秒取样一次,共取样n次。其中-o file表示取样结果将以二进制形式存入文件file中。

  另一种语法如下: 程序代码
sar [-option] [-s time] [-e time] [-i sec] [-f file]

 

   含义是表示从file文件中取出数据,如果没有指定-f file,则从标准数据文件/var/adm/sa/sadd取数据,其中dd表示当前天。另外,-s time表示起始时间;-e time表示停止时间;-i sec表示取样的时间间隔,如果不指定则表示取文件中所有的数据。对于具体的选项参见表1。

  一般它与-q和-u联合使用,以便对每个CPU的使用情况进行分析,比如运行如下命令:

 程序代码
sar -q -u 5 1

将输出如下:
 程序代码
Linux 2.4.18-18smp (builder.linux.com)  2003年03月07日

09时46分16? CPU %user %nice %system %idle
09时46分21? all 0.20 0.00 0.00 99.80

09时46分16? runq-sz plist-sz ldavg-1 ldavg-5
09时46分21? 0 91 0.00 0.00

Average: CPU %user %nice %system %idle
Average: all 0.20 0.00 0.00 99.80

Average: runq-sz plist-sz ldavg-1 ldavg-5
Average: 0 91 0.00 0.00


  下面将举例说明。 

例一:使用命令行 sar -u t n 

例如,每60秒采样一次,连续采样5次,观察CPU 的使用情况,并将采样结果以二进制 
形式存入当前目录下的文件zhou中,需键入如下命令: 

sar -u -o zhou 60 5 

屏幕显示: 

  SCO_SV   scosysv 3.2v5.0.5 i80386   10/01/2001 
    14:43:50   %usr   %sys  %wio    %idle(-u) 
    14:44:50   0     1    4      94 
    14:45:50   0     2    4      93 
    14:46:50   0     2    2      96 
    14:47:50   0     2    5      93 
    14:48:50   0     2    2      96 
    Average    0     2    4      94 

在显示内容包括: 

  %usr:CPU处在用户模式下的时间百分比。 
  %sys:CPU处在系统模式下的时间百分比。 
  %wio:CPU等待输入输出完成时间的百分比。 
  %idle:CPU空闲时间百分比。 

在所有的显示中,我们应主要注意%wio和%idle,%wio的值过高,表示硬盘存在I/O瓶颈, 
%idle值高,表示CPU较空闲,如果%idle值高但系统响应慢时,有可能是CPU等待分配内存, 
此时应加大内存容量。%idle值如果持续低于10,那么系统的CPU处理能力相对较低,表 
明系统中最需要解决的资源是CPU。 

如果要查看二进制文件zhou中的内容,则需键入如下sar命令: 

    # sar -u -f zhou 

可见,sar命令即可以实时采样,又可以对以往的采样结果进行查询。 

例二:使用命行sar -v t n 

例如,每30秒采样一次,连续采样5次,观察核心表的状态,需键入如下命令: 

sar -v 30 5 

屏幕显示: 
      SCO_SV scosysv 3.2v5.0.5 i80386 10/01/2001 
      10:33:23 proc-sz ov inod-sz ov file-sz ov lock-sz   (-v) 
10:33:53 305/ 321  0 1337/2764  0 1561/1706 0 40/ 128 
10:34:23 308/ 321  0 1340/2764  0 1587/1706 0 37/ 128 
10:34:53 305/ 321  0 1332/2764  0 1565/1706 0 36/ 128 
10:35:23 308/ 321  0 1338/2764  0 1592/1706 0 37/ 128 
10:35:53 308/ 321  0 1335/2764  0 1591/1706 0 37/ 128 

显示内容包括: 

proc-sz:目前核心中正在使用或分配的进程表的表项数,由核心参数MAX-PROC控制。 

  inod-sz:目前核心中正在使用或分配的i节点表的表项数,由核心参数 
MAX-INODE控制。 

  file-sz: 目前核心中正在使用或分配的文件表的表项数,由核心参数MAX-FILE控 
制。 

  ov:溢出出现的次数。 

  Lock-sz:目前核心中正在使用或分配的记录加锁的表项数,由核心参数MAX-FLCKRE 
控制。 

显示格式为 

实际使用表项/可以使用的表项数 

显示内容表示,核心使用完全正常,三个表没有出现溢出现象,核心参数不需调整,如 
果出现溢出时,要调整相应的核心参数,将对应的表项数加大。 

例三:使用命行sar -d t n 

例如,每30秒采样一次,连续采样5次,报告设备使用情况,需键入如下命令: 

sar -d 30 5 

屏幕显示: 

      SCO_SV scosysv 3.2v5.0.5 i80386 10/01/2001 
11:06:43 device %busy   avque   r+w/s  blks/s  avwait avserv (-d) 
11:07:13 wd-0   1.47   2.75   4.67   14.73   5.50 3.14 
11:07:43 wd-0   0.43   18.77   3.07   8.66   25.11 1.41 
11:08:13 wd-0   0.77   2.78   2.77   7.26   4.94 2.77 
11:08:43 wd-0   1.10   11.18   4.10   11.26   27.32 2.68 
11:09:13 wd-0   1.97   21.78   5.86   34.06   69.66 3.35 
Average wd-0   1.15   12.11   4.09   15.19   31.12 2.80 

显示内容包括: 

device: sar命令正在监视的块设备的名字。 
  %busy: 设备忙时,传送请求所占时间的百分比。 
  avque: 队列站满时,未完成请求数量的平均值。 
  r+w/s: 每秒传送到设备或从设备传出的数据量。 
  blks/s: 每秒传送的块数,每块512字节。 
  avwait: 队列占满时传送请求等待队列空闲的平均时间。 
  avserv: 完成传送请求所需平均时间(毫秒)。 

在显示的内容中,wd-0是硬盘的名字,%busy的值比较小,说明用于处理传送请求的有 
效时间太少,文件系统效率不高,一般来讲,%busy值高些,avque值低些,文件系统 
的效率比较高,如果%busy和avque值相对比较高,说明硬盘传输速度太慢,需调整。 

例四:使用命行sar -b t n 

例如,每30秒采样一次,连续采样5次,报告缓冲区的使用情况,需键入如下命令: 

sar -b 30 5 

屏幕显示: 

  SCO_SV scosysv 3.2v5.0.5 i80386 10/01/2001 
14:54:59 bread/s lread/s %rcache bwrit/s lwrit/s %wcache pread/s pwrit/s (-b) 
14:55:29 0  147  100  5  21  78   0   0 
14:55:59 0  186  100  5  25  79   0   0 
14:56:29 4  232   98  8  58  86   0   0 
14:56:59 0  125  100  5  23  76   0   0 
14:57:29 0   89  100  4  12  66   0   0 
Average  1  156   99  5  28  80   0   0 

显示内容包括: 

bread/s: 每秒从硬盘读入系统缓冲区buffer的物理块数。 
lread/s: 平均每秒从系统buffer读出的逻辑块数。 
%rcache: 在buffer cache中进行逻辑读的百分比。 
bwrit/s: 平均每秒从系统buffer向磁盘所写的物理块数。 
lwrit/s: 平均每秒写到系统buffer逻辑块数。 
%wcache: 在buffer cache中进行逻辑读的百分比。 
pread/s: 平均每秒请求物理读的次数。 
pwrit/s: 平均每秒请求物理写的次数。 

在显示的内容中,最重要的是%cache和%wcache两列,它们的值体现着buffer的使用效 
率,%rcache的值小于90或者%wcache的值低于65,应适当增加系统buffer的数量,buffer 
数量由核心参数NBUF控制,使%rcache达到90左右,%wcache达到80左右。但buffer参数 
值的多少影响I/O效率,增加buffer,应在较大内存的情况下,否则系统效率反而得不到 
提高。 

例五:使用命行sar -g t n 

例如,每30秒采样一次,连续采样5次,报告串口I/O的操作情况,需键入如下命令: 

sar -g 30 5 

屏幕显示: 

SCO_SV scosysv 3.2v5.0.5 i80386  11/22/2001 
17:07:03  ovsiohw/s  ovsiodma/s  ovclist/s (-g) 
17:07:33   0.00   0.00   0.00 
17:08:03   0.00   0.00   0.00 
17:08:33   0.00   0.00   0.00 
17:09:03   0.00   0.00   0.00 
17:09:33   0.00   0.00   0.00 
Average    0.00   0.00   0.00 

显示内容包括: 

ovsiohw/s:每秒在串口I/O硬件出现的溢出。 

ovsiodma/s:每秒在串口I/O的直接输入输出通道高速缓存出现的溢出。 

ovclist/s :每秒字符队列出现的溢出。 

在显示的内容中,每一列的值都是零,表明在采样时间内,系统中没有发生串口I/O溢 
出现象。 

sar命令的用法很多,有时判断一个问题,需要几个sar命令结合起来使用,比如,怀疑 
CPU存在瓶颈,可用sar -u 和sar -q来看,怀疑I/O存在瓶颈,可用sar -b、sar -u和sar-d来看。
--------------------------------------------------------------------------------

0 0