数据库水平切分方法
来源:互联网 发布:软件开发进度计划 编辑:程序博客网 时间:2024/05/01 00:39
方法一:使用MD5哈希
做法是对UID进行md5加密,然后取前几位(我们这里取前两位),然后就可以将不同的UID哈希到不同的用户表(user_xx)中了。
function getTable( $uid ){ $ext = substr ( md5($uid) ,0 ,2 ); return "user_".$ext;}
通过这个技巧,我们可以将不同的UID分散到256中用户表中,分别是user_00,user_01 ...... user_ff。因为UID是数字且递增,根据md5的算法,可以将用户数据几乎很均匀的分别到不同的user表中。
但是这里有个问题是,如果我们的系统的用户越来越多,势必单张表的数据量越来越大,而且根据这种算法无法扩展表,这又会回到文章开头出现的问题了。
方法二:使用移位
具体方法是:
public function getTable( $uid ) { return "user_" . sprintf( "%04d", ($uid >> 20) );}
这里,我们将uid向右移动20位,这样我们就可以把大约前100万的用户数据放在第一个表user_0000,第二个100万的用户数据放在第二个表user_0001中,这样一直下去,如果我们的用户越来越多,直接添加用户表就行了。由于我们保留的表后缀是四位,这里我们可以添加1万张用户表,即user_0000,user_0001 ...... user_9999。一万张表,每张表100万数据,我们可以存100亿条用户记录。当然,如果你的用户数据比这还多,也不要紧,你只要改变保留表后缀来增加可以扩展的表就行了,如如果有1000亿条数据,每个表存100万,那么你需要10万张表,我们只要保留表后缀为6位即可。
上面的算法还可以写的灵活点:
/** * 根据UID分表算法 * * @param int $uid //用户ID * @param int $bit //表后缀保留几位 * @param int $seed //向右移动位数 */function getTable( $uid , $bit , $seed ){ return "user_" . sprintf( "%0{$bit}d" , ($uid >> $seed) );}
总结:
上面两种方法,都要对我们当前系统的用户数据量做出可能最大的预估,并且对数据库单个表的最大承受量做出预估。
比如第二种方案,如果我们预估我们系统的用户是100亿,单张表的最优数据量是100万,那么我们就需要将UID移动20来确保每个表是100万的数据,保留用户表(user_xxxx)四位来扩展1万张表。
又如第一种方案,每张表100万,md5后取前两位,就只能有256张表了,系统总数据库就是:256*100万;如果你系统的总数据量的比这还多,那你实现肯定要MD5取前三位或者四位甚至更多位了。
两种方法都是将数据水平切分到不同的表中,相对第一种方法,第二种方法更具扩展性。。。
- 数据库水平切分方法
- 数据库水平切分方法
- 数据库水平切分方法
- 数据库水平切分方法
- 水平切分数据库方式
- 数据库水平切分举例
- 数据库水平切分法
- 数据库水平切分
- 数据库的垂直切分和水平切分
- 数据库的垂直切分和水平切分
- 数据库的垂直切分和水平切分
- 数据库的垂直切分和水平切分
- 数据库的垂直切分和水平切分
- 数据库的垂直切分和水平切分
- 数据库的垂直切分和水平切分
- 如何将数据库水平切分
- 如何将数据库水平切分
- 数据库垂直和水平切分
- Google全程面试题目
- 十道海量数据处理面试题与十个方法大总结
- 他是个天才和疯子,乔布斯办公室语录
- 云计算的一个比喻
- 数据库设计规范化的五个要求
- 数据库水平切分方法
- 给数据减肥 让MySQL数据库跑的更快
- 敏捷和架构的冲突
- 给移动应用开发新手的6个建议
- 开发"愤怒的小鸟"的Lua语言:Wax框架详解
- Bash shell中的位置参数$#,$*,$@,$0,$1,$2...及特殊参数$?,$-等的含义
- iphone开发环境 搭建2 Xcode iphoneSdk
- Delphi三层开发小技巧:TClientDataSet的Delta妙用
- Delphi之面向对象的界面复用技术