guava cache编程实践总结

来源:互联网 发布:知乎匿名的回答在哪里 编辑:程序博客网 时间:2024/06/06 14:19

guava cache是google开源代码库中的一个辅助功能模块,可以作为JVM嵌入式cache来使用,基于key-value模型。对于Rdedis、Memcached,这种缓存系统,我们称之为“分布式缓存”,它们通过集群扩容,可以将海量数据cache在远端。而guava cache,作为“嵌入式cache”,这些cache的数据寄宿在当前JVM堆中,和JVM进程具有共同生命周期。它具备如下特点:

  • 占用JVM内存,内部数据结构类似于ConcurrentHashMap。
  • 因为JVM堆大小的限制,guava cache只能保存较少的数据量,不能超过JVM Heap。
  • 相对Redis等“分布式缓存”,它本身不需要RPC调用,性能较高。

    如果你的系统中,有一种数据符合“尺寸较小”、“高频的读取操作”、“变更操作较少”,那么使用guava cache这种“嵌入式缓存”,将非常适合,它将会带来巨大的性能提升。

 

    Guava cache读取过程也符合“get-if-absent-compute”语义,即如果本地缓存中有,则返回对应value,如果key不存在,则通过“加载机制”获取新的value。

  • 通过Cache.put相关方法,将key-value加入缓存。
  • 通过Cache.get,从cache中获取key对应的value。
  • 通过Cache.invalidate,将key-value通缓存中移除。

 

CacheBuilder:用来构建Cache,可以在构建时指定一些全局的参数。

Java代码  收藏代码
  1. CacheBuilder cacheBuilder = CacheBuilder.newBuilder()  
  2.                 .concurrencyLevel(Runtime.getRuntime().availableProcessors() - 1)  
  3.                 .initialCapacity(1024);  
  4. //maxCacheSize由外部注入,表示cache中保存的key的最大条数  
  5. if(maxCacheSize > 0) {  
  6.     cacheBuilder.maximumSize(maxCacheSize);  
  7. }else if(maxKeysWeight > 0) {  
  8. //maxKeysWeight由外部注入,逻辑上用来表示一种“权重”,  
  9. //本例中,我们将key所占的字节数,作为weight。  
  10. //当cache中所有的“weight”总和达到maxKeyWeight时,将会触发“剔除策略”。  
  11.     cacheBuilder.maximumWeight(maxKeysWeight)  
  12.             .weigher(new Weigher<String, Object>() {  
  13.                 @Override  
  14.                 public int weigh(String key, Object value) {  
  15.                     //粗略估计,不适用key.getBytes,避免一次不必要的解析与copy  
  16.                     return key.length();  
  17.                 }  
  18.             });  
  19. }  

 

    需要注意,在Guava Cache中,“maximumSize”和“maximumWeight”两种控制cache量的参数,是互斥的,即同时只能设置其中一个。

 

    如果cache中不存在Key,那么意味着这个key的数据需要从一个可靠的地方load,我们有2中方式:

1、通过CacheLoader:

Java代码  收藏代码
  1. LoadingCache cache = cacheBuilder.build(new CacheLoader<String, Object>() {  
  2.                     //如果loader中返回null,则使用NULL占位符替代。  
  3.                     public Object load(String key) throws Exception {  
  4.                         if(valueLoader == null) {  
  5.                             return NULL;  
  6.                         }  
  7.                         Object value = valueLoader.get(key);  
  8.                         if(value == null) {  
  9.                             value = NULL;  
  10.                         }  
  11.                         return value;  
  12.                     }  
  13.                 });  

 

    其中valueLoader,是一个自定义的加载器,我们假定valueLoader.get方法,是通过redis从远端获取新的数据。CacheLoader的适应场景就是:当Guava Cache中没有key时,将会通过其load方法加载数据,并保存在Cache中。load方法不能返回NULL。

 

2、通过Callable:

    1)中,LoadingCache这个类通过和CacheLoader配合,完成Key的延迟加载。当然如果你不想使用CacheLoader这种统筹的方式,可以使用Callable接口, 那么你可以在需要的地方,使用Callable来自定义load操作。

Java代码  收藏代码
  1. Cache<String,Object> cache = cacheBuilder.build();  
  2. cache.get("user_id_10000"new Callable<Object>() {  
  3.     @Override  
  4.     public Object call() throws Exception {  
  5.         return redisClient.get("user_id_10000");  
  6.     }  
  7. });  

 

    跟CacheLoader一样,callable.call方法返回的数据也会保存在Cache中。

 

Cache中数据“剔除”(Eviction)

    用户对cache的盲目使用,可能导致cache中数据不断增大,一个残酷的现实就是RAM资源非常有限,所以我们需要将那些不常用的数据移除,Guava cache基于LRU策略剔除数据,开发者只需要控制剔除数据的时机即可。

 

1、Size-based

    通过上述例子,我们已经知道可以通过CacheBuilder.maximumSize(long)方法指定cache中允许的key的个数。如果key的个数即将超过阀值(边际),将会根据LRU算法,剔除那些不常用的K-V。

 

    此外,如果你的每个Key-Value有不同的“weights”--比如每个K-V占用不同的内存量,我们可以用“weight”来描述这一指标。通过使用CacheBuilder.maximumWeights(long)和CacheBuilder.weigher(Weigher)来达成这一目的,当cache中put一个key时,都会计算它的weight值,并累加,当达到maximumWeight阀值时,会触发剔除操作。

 

2、Timed Eviction

    CacheBuilder提供了2中基于“时间”的剔除方式:

  • expireAfterAccess(long,TimeUnit):当key在被“read/write”操作之后,空闲多久后被删除。
  • expireAfterWrite(long,TimeUnit):当key被write(put或者reload)操作之后,空闲多久后被删除。

3、Reference-based

    JAVA中,一个对象的引用类型分为“强、弱、软”(还有“虚引用”),Guava Cache中也可以根据Key或者Value的引用类型,并结合GC,来完成cache数据的剔除。

  • CacheBuilder.weakKeys():将key存为WeakReference,如果JVM中,此key没有任何被任何“强引用”、“软引用”对象引用它,那么此K-V将会从cache中移除。
  • CacheBuilder.weakValues():同上。
  • CacheBuilder.softValues():同上。

“显性”移除

  • Cache.invalidate(key)
  • Cache.invalidateAll(keys)
  • Cache.invalidateAll():移除所有的数据

    CacheBuilder不会在数据过期时立即执行cleanup,这种数据剔除操作,通常是延迟的,在边际条件时,某些write或者read操作会触发cleanup。如果想更加及时的清理过期数据,那么需要自己去创建一个thread,然后周期性的执行cache.cleanUp()。Guava Cache并没有这么做,它主要考虑到,这种“cleanup”会和用户的正常操作产生“锁冲突”,对性能会有额外的干扰。如果开发者能够预料这种事情,那么你就可以这么做。


转载from:http://shift-alt-ctrl.iteye.com/blog/2193617

0 0