故障排除(一)

来源:互联网 发布:wow 国服 mac 编辑:程序博客网 时间:2024/05/05 23:07

本机或本地服务器运行缓慢时:

                机器运行缓慢通常是由于消耗太多系统特定的资源,资源有CPU,RAM,磁盘I/O以及网络。

解决这个问题,考虑的问题:

1:平均负载(uptime)可能是最先用到的基本度量标准,并且平均负载不会因为CPU的数量而改变。

2:使用top命令解决负载问题。查看id(CPU空闲时间),如果id值高而系统运行慢,则排除高CPU负载,再看id。

                                                        查看wa(I/O等待)。如果wa值低而系统运行慢,则排除磁盘或者网络I/O的问题,先看wa。

3:由于用户CPU时间比过高引起的高负载(时间高且id小),在top中的%CPU查看,可以kill掉大量使用内存时间的进程。

4:内存不足的问题:在top中Mem:和Swap:,辨别是否耗尽RAM的方法是查看文件缓存cache,如果实际用的内存减去cache的值(实际上使用RAM)很大,同时交换存储的值也很高,很有可能的确内存问题。在top中的%MEM查看,同样kill掉。当系统内存快要耗尽,OOM(out of memory)终结者会开始终止进程,在/var/log/syslog中可以看到。

5:高I/O等待时间问题:先看RAM,如果还有大量可用的RAM,则考虑那个进程占用大量I/O,用iostat查看也可以用iotop。

问题发生后的高负载处理:

1:配置sysstat,isstat就是在sysstat的包中,并且包含能报告CPU和RAM,配置文件为:/etc/sysconfig/sysstat

2:查看CPU统计信息,使用sysstat中的sar工具

3:查看RAM统计信息,使用sar -r查看

4:查看磁盘I/O统计信息,使用sar -b查看

5:查看某一时间段的统计信息,使用sar -s 开始时间 -e 结束时间,这个是CPU的时间段。



0 0
原创粉丝点击