HBase Capacity Planning
来源:互联网 发布:网络歌曲改编歌词 编辑:程序博客网 时间:2024/06/07 02:38
1. Physical data sizeGanglia监控disk存储状态
2. JVM GC Lmitations考虑到GC问题,RS的max heap size一般推荐设置为16GB左右
3. Region count & size 估算region数量的Formula: (RS memory)*(total memstore fraction)/((memstore size)*(# column families))比如: 一个RS 有16GB Mem, memstore fraction 0.4 , memstore max size 128MB 16GB * 0.4/(128MB) 约等于 51 regions。 对于存储了多个表,column families值为所有families个数的总和。但是,一般情况下,memstore的存储空间是没有打满的,所以一个RS对regions的容量可以是公式计算值的2-3倍.在hbase官方book-9.7.1.1节,一个RS最好维护大约100个regions,理由是:1> 每个memstore 的MSLAB需要2MB。假设一个RS有1000个regions,每个region有两 个CF, MSLAB就要占用4GB左右的Mem, 这些Mem没有存任何数据. 2> 一个RS如果有太多的regions,比如1000 那么总的memstore size很容易超过设置的阈值,这样会造成大量tiny flush,即形成很多size 很小的storefiles,导致大量的compactions发生。3> RS上regions数量太多,那么RS宕机恢复时,master reassgin them需要很长的时间.4> 一个RS上有太多的regions,相应的index也会增多,占用的Mem也会增加。当然,数据很多,但是region数量很少也不能达到很好读写效果。Region max size:Region max size受限于compact,因为size 太大,major compact将会占用过多的时间,影响读写性能。推荐的max size: 10GB-20GB。
4. Total data size per RS根据上面的数据,一个RS能够存储的数据size 大约为 (10GB~20GB) * 100 即1TB到2TB左右。 当然,考虑到blockcache size最大设置10GB时,cache data才占总数据的1%, 为了有更好的读性能, 那么可是适当减少存储的数据。5. compact & split HBase 优化必须考虑的两点:
split policy:
- ConstantSizeRegionSplitPolicy
- IncreasingToUpperBoundRegionSplitPolicy
- KeyPrefixRegionSplitPolicy
need ycsb test, see later...
0 0
- HBase Capacity Planning
- Linux Performance Tuning and Capacity Planning
- Performance by Design: Computer Capacity Planning By Example
- Guerrilla Capacity Planning: A Tactical Approach to Planning for Highly Scalable Applications and Se
- Using TFS 2012 and SCRUM for Iteration Capacity Planning for Software Development
- 自己去设计es的分片数量安排的方法--Capacity Planning--es横向扩展设计
- Planning
- Planning
- Planning
- Planning
- Planning
- Planning
- Capacity Management
- 容量(capacity)
- vector.capacity()
- capacity size
- vector::capacity
- Study Planning
- 各种排序的实现:希尔 归并 堆排 快排
- Dom编程(Window 对象)
- HDU--3605 Escape (多重匹配)
- poj 2724 Purifying Machine 二分图最大匹配
- IOS调用系统震动和系统声音
- HBase Capacity Planning
- 大数据公司实践零售O2O:打通线上线下,全触点大会员
- POJ 1751 Prim
- HDU 3657 Game | 最小割 (补)
- EXT4.1 tabpanel
- Irrlicht例程05:创造一个有声世界(下)
- Android dev tips(update at 2015-11-26)
- 广工 数据结构 7.23
- Nginx的Upstream负载均衡与反向代理的配置