uksm

来源:互联网 发布:连帽衫里面穿什么 知乎 编辑:程序博客网 时间:2024/05/22 21:24

Linux相同页面合并机制(KSM)使得内存中相同的页面,可以通过修改页表的方式合并成一个。通常这个机制被应用在有众多虚拟机(目前仅支持 KVM)或者有很多冗余内存数据的场景(如有很多类似数据工作集的并行科学计算)里面。但是,目前它的实现方式仍然比较简陋,UKSM的出现,彻底消除了KSM原本局限,真正使得这项技术能被更多的普通用户使用。具体的来说,它有以下的亮点(原本KSM不具有的特性):

  • 全系统扫描,用户透明。 UKSM现在自动扫描所有用户进程的匿名映射内存区域(包括malloc分配出来的内存)。不需要修改一行应用程序的源码,使用起来超级简单,安装完成以 后,重启使用本站补丁的内核即可(有部分已编译的二进制内核供下载)。起它几乎什么都不需要做(除非你想通过sysfs调整其内部参数)。
  • 不无谓地浪费CPU时间。UKSM自动探测并分析得出包含丰富冗余数据的区域,并在其上全速工作。对于没有太多冗余甚至彻底没有冗余数据的区域,只进行速度非常低(通常情况下,用top看,CPU占用率为0)的采样扫描。而当包含丰富冗余数据的区域出现的时候,它又能非常快速的作出响应。
  • UKSM能够以极快的速度扫描,并合并冗余数据。 在Intel core 2 Q9300的CPU上,KSM的官方评测其内存合并速度最高在260M/s左右,而实际工作的平均速度在几十M每秒。由于采用了全新的hash算法,相同的硬件环境下面,我们的算法的合并速度最高可达到477MB/sec ∼ 923MB/sec。而对于不包含冗余数据的页面上,UKSM的扫描速度最高是627MB/sec ∼ 2445MB/sec。正因为有如此惊人的速度,全系统扫描才真正成为可能。而对于已有的KVM的冗余消除应用来说,速度上无疑是一个质的的飞跃!
  • 抖动区域避免。UKSM能实时自动地发现不友好的抖动区域,并降低其上的扫描速度,避免在此类区域上浪费时间。

本项目的相关特性,可以实实在在体现在评测结果上!请到评测区寻找你感兴趣的评测项目,如果你希望有或者能提供更多的评测数据,请联系我们,或者在论坛发帖。

我已经用上了

rains@rains ~ $ uname -a
Linux rains.localhost 3.2.16-uksm #1 SMP PREEMPT Wed Apr 25 09:11:11 CST 2012
x86_64 Intel(R) Core(TM) i5 CPU M 450 @ 2.40GHz GenuineIntel GNU/Linux

这是开虚拟机前的内存使用状况
rains@rains ~ $ free
total used free shared buffers cached
Mem: 8039316 2186536 5852780 0 56 1530004
-/+ buffers/cache: 656476 7382840
Swap: 4194300 0 4194300

下面是开了三个虚拟机的状况,三个虚拟机都是分配了1G Mem的。
rains@rains ~ $ free
total used free shared buffers cached
Mem: 8039316 3900416 4138900 0 56 497624
-/+ buffers/cache: 3402736 4636580
Swap: 4194300 0 4194300