程序博客网 > 围棋打谱 mac

Druid的Coordinator负载均衡原理

来源：互联网发布：围棋打谱 mac 编辑：程序博客网时间：2024/06/05 19:06

此方法在Druid 0.9.1.1 release版本中已上线。

segment是druid的工作单元。当执行一个query的时候，每个segment被分配给一个core，各个segment并行计算。query的查询范围从几小时到几周不等，对每个查询，我们想最大限度的使用CPU cores。因此，对每一个给定的时间段，我们要把data放在尽可能多的server上，即跨多个服务器分散数据。

Druid coordinator节点负责分发各个segment，考虑数据的复制策略，把realtime的数据移动到historical。

Coordinator均衡原理

1. 原始方法

1）随机选取一个有足够空间的node，把segment放入即可。不适用于集群的动态扩展，最新数据区成为访问热点。

2）node按剩余空间排序，选择剩余空间最大的node放入segment。

2. 均衡算法

目标

避免热点，把segment放在尽可能多的server上，最大化并行计算；查找segment大小对CPU占有率的影响。

解决方案

定义成本函数cost(x,y)，segment x在server Sk上的成本：TotalCost(x,Sk)=∑y∈Sk∖{x}cost(x,y)

对每一个新的segment，coordinator计算它在每一个server上的cost，然后把segment放在成本最小的server上。为了平衡集群，druid用贪心再平衡策略，随机选取一个segment，将其放在成本最小的server上。

核心问题

cost函数的选取。现有的选取方案用了多种启发方案，如segment大小、segment间隔间的“距离”由segments覆盖的时间间隔决定。这种以来，较大的segment需要更多的CPU时间来扫描，在时间间隔上“近”的segments大多同时被查询。

结果

work fine，查询速度为常量；但问题是不同server间差别很小，算法改进的可能性很小。

3. 改进cost函数

cost函数缺点

太多参数，有“扭结”和“高原”，导致有时看到的是局部集群。

目标

（1）cost函数应该反映扫描segment的成本；

（2）同时扫描多个segments时的成本；

（3）cost函数应具有可加性 segments A, B, and C, cost(A,B∪C)=cost(A,B)+cost(A,C)（保证在数据分片时，cost函数具有独立性，不论是一个覆盖一天的segment，还是24个segments每个覆盖1h，cost一致）

解决方案

解决问题1 ：假定扫描一个时间单位的data时间一定，为常量；cost函数只依赖于segment间隔；

解决问题2：用指数衰减相互作用函数

来表示查询两个时间片的成本，t表示两个时间片的相对时间差，λ表示相互作用衰减的速率。这个函数调控相互作用，减少了当时间差增大时二者的相互作用成本。

two segments X and Y covering intervals X=[x0,x1) and Y=[y0,y1)，

由于每一个segment都在一个data source上，接下来考虑X和Y是否在同一个data source上的情况。

结果

query速度提升30-40%。

0 0

围棋打谱 mac

围棋打谱 mac

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子强力打造强力霉素片强力巨彩强力 350强力打造免费高速高 34qao强力打造免费高速高清 35opa免费强力打造基地手机版 49炮强力打造免费高速高 37qao强力打造免费高 999强力枇杷露 350炮强力打造免费高速高强力新材股吧公公的强力棒强力枇杷露喝死人 35pao强力打造强力枇杷露说明书强力定眩胶囊 885炮强力打造免费高速高强力脑心康胶囊星际强力联姻强力家具图片强力巨彩光电科技公司 led显示屏厂家全彩led显示屏强取豪夺南枝攻一见钟情强取豪夺囚禁强取豪夺高干文男主强取豪夺女主很h 强取豪夺囚禁文高干强取豪夺囚禁文男主强取豪夺女主软有肉男主强取豪夺强取豪夺之兄弟羁绊强取豪夺文强取豪夺古言强取男主对女主强取豪夺肉强取豪夺之过程by无仪宁死总裁强取豪夺虐身囚禁女主柔弱的强取豪夺文皇帝强取豪夺臣妻的