Solaris设备管理和性能监控之Swap空间管理

来源:互联网 发布:照片编辑软件在线 编辑:程序博客网 时间:2024/05/10 08:58

首先介绍什么是swap空间 

什么是SWAP(交换)空间
对于一般的Solaris系统管理员来说,很少会接触Swap(交换)空间,在他们看来Swap区只不过是磁盘上的一两个分区或是几个Swap(交换)文件,当系统没有足够的物理内存来处理当前进程的时候,就利用Swap(交换)空间作为虚拟内存的临时存储空间,这种说法从技术角度来说是没有错的,但Solaris在实现Swap时有其非常独特的地方。  

SWAP空间作用   

众所周知,现代操作系统都实现了“虚拟内存”这一技术,不但在功能上突破了物理内存的限制,使程序可以操纵大于实际物理内存的空间,更重要的是“虚拟内存”是隔离每个进程的安全保护网,使每个进程不受其他程序的干扰。  

Swap空间的作用可简单描述为:当系统的物理内存不够用的时候,就需要将物理内存中的一部分空间释放出来,以供当前运行的程序使用。那些被释放的空间可能来自一些很长时间没有什么操作的程序,这些被释放的空间被临时保存到Swap空间中,等到那些程序要运行时,再从Swap中恢复保存的数据到内存中。这样,系统总是在物理内存不够时,才进行Swap交换。这种现象对于计算机使用者是经常遇到的。

有一点要声明的是,并不是所有从物理内存中交换出来的数据都会被放到Swap中(如果这样的话,Swap会不堪重负),有相当一部分的数据直接交换到文件系统。例如,有的程序会打开一些文件,对文件进行读写(其实每个程序都至少打开一个文件,那就是运行程序本身),当这些程序的内存空间需要交换出去时,文件部分的数据就没有必要放到Swap空间中了,如果是读文件操作,那么内存数据直接就释放了,不需要交换出来,因为下次需要时,直接从文件系统就能恢复;如果是写文件,只需要将变化的数据保存到文件中,以便恢复。但是那些用malloc(3C)和new函数生成的对象的数据则不同,需要Swap空间,因为它们在文件系统中没有相应的“储备”文件,因此被称为“匿名” (Anonymous)的内存数据,这类数据还包括堆栈中的一些状态和变量数据等,所以说,Swap空间是“匿名”数据的交换空间。  

Swap的配置对性能的影响   

太多的Swap空间会浪费磁盘的空间,而太少的Swap空间,系统则会发生错误。如果系统的物理内存用光了,你的系统就会跑得慢,但仍能运行;如果Swap空间用光了,那么系统就会发生错误。例如,Web服务器能根据不同的请求数量衍生出多个服务进程(或线程),如果Swap空间用完,则服务进程无法进动,通常会出现"application is out of memory"的错误,严重时会造成服务进程的死锁。因此Swap空间的分配是很重要的。  

通常情况下,Swap空间应大于或等于物理内存的大小,最小不应小于64M,通常Swap空间的大小应是物理内存的2-2.5倍(Solaris 2以上的版本有所变化,见下文)。但根据不同的应用,应有不同的配置:如果是小的桌面系统,只需要较小的Swap空间,而大的服务器系统则视情况不同需要不同大小的Swap空间。特别是数据库服务器和Web服务器会随着访问量的增加,对Swap 空间的要求也会增加,具体配置参见各自服务器产品的说明。  

另外,Swap分区的数量对性能也有很大的影响。因为Swap交换的操作是磁盘I/O的操作,如果有多个Swap交换区,Swap空间的分配会以轮流的方式操作于所有的Swap,这样会大大均衡I/O的负载,加快Swap交换的速度。如果只有一个交换区,所有的交换操作会使交换区变得很忙,使系统大多数时间位于等待状态,效率很低,用性能监视工具就会发现,此时的CPU并不很忙,而系统却慢,这说明,瓶颈在I/O上,依靠提高CPU的速度是解决不了问题的。  

性能监视   

Swap空间的分配固然很重要,而系统在运行时的性能监控却更加有价值,通过性能监视工具可以检查系统的各项性能指标,找到系统性能的瓶颈。本文只介绍一下在Solaris下和Swap相关的一些命令和用途。

最常用的是Vmstat命令,在大多数Unix平台下都有此命令,此命令可以查看大多数性能的指标。  

 

另外使用swap -s 也能简单的查看当前swap资源的使用情况。例如:

#swap -s  

total: 65896k bytes allocated + 56840k reserved = 122736k used, 1069456k   

available  

能够方便的看出swap空间的已用和未用资源的大小。应该使Swap保持30%的负载以下,才能保证系统的良好性能。

Solaris中Swap的特点

虚拟Swap空间本来Swap空间就是为虚拟内存服务的,现在Solaris的Swap空间也成为虚拟,这到底是怎么回事呢? 让我们看一个例子就明白了,当在Solaris 2以前版本的Solaris(或其它Unix, 如Linux)上编程时经常会出现一个问题:

假设系统当前还有可用的内存空间为30M,而只剩下10M的Swap空间了,这时,如果有一个进程开始运行并企图执行Malloc(15*1024*1024)的命令(分配15M空间),这个进程会因为这个命令而失败。为什么呢?系统不是有30M可用的内存空间吗?原因在于:你的Swap空间不足,系统认为你在分配空间以后,没有能力(空间)在发生页面交换时,将这部分数据保存起来,因此认为你没有资格分配这块空间。这不是太不公平了吧!也许这15M空间根本不用交换,当前系统可是还有30M内存空间的富余啊!  

还有更不公平的呢?有些大型系统配备了海量的内存,1G或4G,配了这么多内存就是为了避免交换,提高运行速度,可是系统还要为这个系统分配并不需要的Swap空间,占用了大量磁盘资源。为了弥补这个缺陷,Sun为Solaris 2 以后的版本设计了虚拟Swap空间。所谓虚拟的Swap空间,概念其实很简单,swap空间再也不是单指硬盘的分区或文件。虚拟Swap空间包含两个部分:部分物理内存和传统上的Swap分区。经过适当的配置,可以使系统需要Swap空间时,先使用内存部分的swap空间,如果内存部分的swap空间不够,再使用磁盘部分的Swap空间。这样,也许你硬盘上的Swap空间很少得到使用了,甚至根本不需要
Swap分区。  

Swap空间与TMPFS文件系统的关系   

你知道吗?虚拟Swap空间与 /tmp目录有相当大的关系。Sun在实现/tmp目录时,充分考虑了应用程序运行的效率。许多应用程序,特别是数据库服务都会频繁使用 /tmp目录作为临时数据保存区,而Solaris将 /tmp目录下的文件都放在内存中而不是硬盘里,这样会大大提高应用程序的效率。 但是/tmp目录的空间是从系统虚拟空间里挤出来的,是虚拟Swap空间的一部分。如果说,你用完了/tmp空间,也就是用完了Swap空间,所以要小心监视系统的/tmp目录的使用情况,千万别用光了,否则系统会瘫痪!下面两点建议作为参考:  

1.在Mount /tmp目录时,使用(-o Size)选项来控制/tmp目录的大小。

2.当使用编译器编译文件时,如果不想占用Swap空间,则用TMPDIR环境变量指向另外一个临时目录,而不是/tmp目录。

增加Swap空间 

1.成为超级用户 $su - root  

2.创建Swap文件 #mkfile nnn[klblm] filename  

如:

#mkfile 100m swapfile1  

3.激活Swap文件

#/usr/sbin/swap -a /path/filename  

Swap文件必须以绝对路径来指定,filename指的是上一步创建的文件。

4.现在新加的Swap文件已经起作用了,但系统重新启动以后,并不会记住前几步的操作。因此要在/etc/vfstab文件中记录文件的名字,和Swap类型,如:  

/path/filename - - Swap - no -  

5.效验Swap文件是否加上

www.ixdba.net

 

/usr/sbin/swap -l 

删除多余的Swap空间

1.成为超级用户  

2.使用swap -d 命令收回swap空间。  

#/usr/sbin/swap -d /path/filename  

3.编辑/etc/ufstab文件,去掉此Swap(交换)文件的实体。  

4.从文件系统中回收此文件。  

#rm swap-filename  

5.当然,如果此Swap(交换)空间不是一个文件,而是一个分区,则需创建一个新的文件  

系统,再挂接到原来的文件系统上。    

例子:card.263.net  

增加文件系统:在/etc/vfstab中增加  

swap - /var/spool/postfix tmpfs - yes -

 

 

Solaris中的logging功能的应用

Solaris7及其以后版本的系统中有一种称为logging的功能。它不但易于安装和使用,并且对于数据安全非常有用。

UFS是存在于Sun工作站的几乎所有硬盘分区(swap等个别分区除外)上的一种标准的文件系统类型。而logging功能是UFS文件系统的一个挂接选项,它可以被设置在包括/在内的各个硬盘分区上。

SolarisUFS logging通过使用系统中的空白数据块来工作。所有对文件系统数据(metadata,或称为元数据)的修改都被写在这些空白的区域。这些Metadata包括目录和inode信息,不包括文件中的数据本身。比如创建文件时,目录结构被修改并且系统为这个新文件分配一个新的inode。以上这些行为被写入做logging的空间中。一旦数据的修改行为被写入做logging的区域,系统就可以接着对文件系统做其它的操作了。在后台,存在于logging中的信息将被同步到文件系统中,并自动更新相应的目录和I节点,最终完成文件系统的操作。数据也陆续被写入硬盘。因此这种做logging并在后台写入数据,比通过随机的I/O访问直接对分布在硬盘上的各种管理信息进行修改的方式速度要快得多。用来做logging的空间的大小取决于文件系统的大小。每1GB磁盘分区空间的logging空间为1MB,最多不超过64MB。这部分logging空间被循环使用:当log空间即将装满时,暂停新的metadata数据写入,直至log空间被清空。当log中记录的关于文件系统的修改都被应用于文件系统后,那部分空间又重新可以作为log空间来存放新的metadata数据了。

www.ixdba.net

 

通常对于UFS来说,如果操作系统在任何文件系统操作中崩溃,整个文件系统都需要用fsck命令做一致性检查。这个命令的执行可能需要几分钟的时间,因为它需要检测所有的metadata和文件的数据以确认文件系统的完整性:包括当前已经用的空间、未用的、inode的数量等,修复其中不一致的地方。出现比较大的问题时还需要人工干预。在做检查的过程中有可能会丢失文件,甚至目录。这决定于crash发生时,该操作进行到了哪种程度。如果采用logging功能,情况就完全不同。因为metadata的修改首先被写在log空间而不是文件系统中。如果系统崩溃,对文件系统一致性的检测可以仅仅限于log中记录的那部分,这样会更简单、更有效。系统检查logging的数据,以决定在上一次的文件系统中,哪种修改已经做过了,哪种修改即将做,哪种修改正在做, 做过的和即将做但还没有做的操作被系统从log中删掉, 而那些做了一部分的会被接着做完或完全取消掉。如果在log中记录了足够的数据来完成这一操作,该操作会被继续完成。否则,这种改变会被取消。熟悉数据库操作的用户会发现这和数据库软件中的事务处理过程非常相似。最终的结果是:文件系统能够最大限度地保持一致,不需要进行彻底的文件系统检测,整个文件系统检测过程只需要花几秒钟时间。从Solaris 7开始, mount命令和/etc/vfstab文件中也有了一个新的logging选项。

1.14    关于Sun1.14.1  Sun系统中的设备管理

系统中的设备驱动程序

一个计算机系统可以使用很大范围的各种外设和存储设备。比如,你的系统中可能包含SCSI磁盘、键盘、鼠标、磁带机等。还有其它常用设备如:CDROM、打印机、绘图仪、触摸屏、数字化仪等。

Solaris软件不直接和这些设备通信,因为每种设备类型要求不同的数据格式、协议和传输速率。操作系统通过设备驱动程序这种底层的程序与具体的设备通信,也就是设备驱动程序充当操作系统和设备之间的翻译。

系统kernel包括一个很小的与平台有关的核心和一系列模块。核心模块是在系统中完成某一特定任务的软件或硬件组件。核心模块可以在Solaris环境中被动态加载。一个可加载的核心模块的例子就是设备驱动程序。当设备被访问时,设备的驱动程序被加载。

Solaris中,与平台无关的操作系统核心是 /kernel/genunix。适合于特定平台的系统组件是 /platform/`uname m`/kernel/unix

启动时系统测定所连设备,核心动态的作自我配置,把需要的模块加载到内存。磁带机和磁盘等设备在第一次被访问时加载相应驱动。

可以通过修改/etc/system文件来改变核心模块被加载的方式。

/etc/system文件中与模块加载有关的有3处:

moddir

moddir来指明各模块的加载路径。文件中给出了格式为:    

moddir: /kernel  /usr/kernel  /other/modules

exclude

exclude指明在moddir的路径中哪些模块即使在使用时也不加载。格式为:

       excludemodule_name

 

 

forceload

forceload指明哪些模块在启动时就加载,而不是在该模块第一次被使用时加载。格式为:

       forceload: module_name

被指明需要强制加载的模块如果不存在,在启动时会有报警信息给出。如果该模块对系统不重要,可以不理睬该报警。

       Solaris环境中已经包含很大范围的标准设备的驱动程序,存放在 /kernel/drv /platform/`uname m`/kernel/drv 目录中。因此安装很多设备时并不需要同时安装驱动程序。但是如果购买了不被Solaris系统直接支持的设备,设备的生产厂家应该提供对该设备进行正确安装、维护和管理所需的软件。在他们提供的软件中至少应包含设备驱动程序和相应的配置文件(.conf文件)。如果该设备与Solaris中的工具、应用不兼容,需要和设备提供商联系对设备、软件等进行调整,而不是考虑对Sun操作系统本身进行什么修改。

我们经常使用prtconfsysdefdmesg命令来察看系统和设备信息。

prtconf显示系统中设备的树状互连结构。此命令的输出中表示设备时,用设备的instant name。用此命令不但能看出系统中有哪些设备,而且能看出每个设备是通过哪些总线、哪些控制器连接到系统中,每个设备的逻辑设备号。

       sysdef命令可以显示更详细的系统信息,包括hostid、核心结构、设备树、系统中的可加载模块、系统核心参数、部分可调参数的值等。其中也包含prtconf的输出。

       prtconfsysdef命令的输出与机型有关。

       dmesg从系统日志中搜集错误信息并输出。

Solaris中使用3种名称来表示某一设备:物理设备名、逻辑设备名和instance name

物理设备名按照设备的树装互连结构表示设备本身的全路径,是系统对设备的真正访问路径。物理设备名存放在/devices目录下。

逻辑设备名是系统管理员和大部分系统命令使用的。逻辑设备名存放在/dev目录下,并符号链接至/devices目录下的相应文件。

Instance name是核心表示系统中可能存在的每个设备的简单的名字,比如用sd0sd1等表示磁盘。Instance name与物理设备名的映射关系记录在/etc/path_to_inst文件中。