高并发环境下qps计算

来源:互联网 发布:ubuntu配置ip 编辑:程序博客网 时间:2024/05/29 14:39

最近在研究阿里的一些中间件,最近看到了sentinel,由于和我们现在使用的统计-判断-预警-熔断有点类似,所以就深入了源码细看了一下,不看不要紧,一看吓一跳。我们现在的熔断的粒度是分钟级别的,没想到sentinel可以精细到任何级别,甚至是毫秒。我们姑且就按秒来说吧,一对比,就不是一个级别的了。


不说我们之前的架构了,还是说一下阿里sentinel使用的qps计算方法吧,给我印象最深刻的地方就是qps的计算模式了。


大家要知道,按qps为2000来算,每一毫秒就要有2个请求要处理,如果为了获取qps和并发环境下为了数据正确而加锁处理,那么会耗费很大的cpu资源。

而且若按curtime%1000作为key来统计请求数的话,假如当前时间为200ms,那么取得的qps则很有可能是总量的20%,那么肯定是不行的。

其实就是这么一个文件 https://github.com/Netflix/Hystrix/blob/master/hystrix-core/src/main/java/com/netflix/hystrix/util/HystrixRollingNumber.java


分片

首先sentinel采用的方法就是把一段时间分成若干片,如把1s分成10片,那么每片统计当前100ms内的数据,然后当前qps则为当前分片往前推10格,再求和,即为当前的qps。


那么问题来了,在分片的交接时刻,需要为新的分片创建对应的对象,若不加控制的话,直接加锁,会导致所有的线程等待(只有一个线程去创建当前bucket)。但sentinel的模式则是若发现要创建新的bucket,则让一个线程去创建,别的线程则取出上一个bucket进行处理(牺牲了一点时刻准确度,但换来了性能的大量提示)。


longadd

具体到某一个bucket时,需要对当前的bucket的value进行增加,传统的思路就是再对这个bucket的value进行加锁,那么这个地方就又回阻塞了,那么有没有好的办法的。肯定有啦,看sentinel的思路吧,其实就是用到了netflix的hytrixRollingNumber的办法(https://github.com/Netflix/Hystrix)。具体一点就是Striped64。


数据 striping 就是把逻辑上连续的数据分为多个段,使这一序列的段存储在不同的物理设备上。通过把段分散到多个设备上可以增加访问并发性,从而提升总体的吞吐量


在JDK 8中,已经添加到的 java.util.concurrent.atomic 下的 Striped64 了。


abstract class Striped64 extends Number {    static final int NCPU = Runtime.getRuntime().availableProcessors();     // 存放 Cell 的表。当不为空时大小是 2 的幂。    transient volatile Cell[] cells;     // base 值,在没有竞争时使用,也作为表初始化竞争时的一个后备。    transient volatile long base;     // 自旋锁,在 resizing 和/或 创建Cell时使用。    transient volatile int cellsBusy;}


@sun.misc.Contended static final class Cell {     volatile long value;     Cell(long x) { value = x; }     final boolean cas(long cmp, long val) {          return UNSAFE.compareAndSwapLong(this, valueOffset, cmp, val);     }     // Unsafe mechanics     private static final sun.misc.Unsafe UNSAFE;     private static final long valueOffset;     static {          try {               UNSAFE = sun.misc.Unsafe.getUnsafe();               Class<?> ak = Cell.class;               valueOffset = UNSAFE.objectFieldOffset                    (ak.getDeclaredField("value"));          } catch (Exception e) {               throw new Error(e);          }     }}

看上面的注释应该就能看懂了吧,思路就是把锁的粒度变小,刚好这种思路是非常适合处理qps的。当然真实的value就是Striped64.value + Cell[0-n].value之和的,所以这种设计思路可以达到写基本是O(1)的,读会耗电cpu。但正是我们想要的了。





0 0