mysql主从复制、读写分离到数据库水平拆分及库表散列

来源：互联网发布：淘宝客和直通车的区别编辑：程序博客网时间：2024/06/06 12:50

web项目最原始的情况是一台服务器只能连接一个mysql服务器（c3p0只能配置一个mysql），但随着项目的增大，这种方案明显已经不能满足需求了。

Mysql主从复制，读写分离：

上面的方案使用mysql-Proxy代理，分发读写请求，写操作转发到Mysql主服务器，读操作转发到Mysql从服务器(多个)，Mysql主服务器数据有变动时，会把变化以二进制的形式写入到log日志里，然后Mysql从服务器再从log日志中读取变化数据，以完成数据同步。

缺点：因为Mysql分发代理和Mysql主服务器都只有一台，一旦宕机就不行了，即很不稳定。

改进方案：

1，把tomcat和mysql代理放一台服务器上，比如一个项目有10台App服务器，每台服务器上都有tomat和Mysql-Proxy，进行数据库操作时，tomcat先连接本机上的myql代理，代理帮忙转发到各个mysql

2，同时，为了使mysql主机可靠，mysql主机也要配置多台，为了实现这种功能，要在多台myql主机之前配置负载均衡服务器，同时为了保证负载均衡服务器的可靠性，还要配置负载均衡—备机。虽然mysql主机有多台，但要保证只有一台会把数据变化写入到log日志里。

缺点：

1，会有数据延迟，比如mysql主机被写入修改了数据，但mysql从机还需要时间进行同步

2，比如运行一年之后，mysql主机上已经有了1千万条数据，并且这些数据都会被同步到所有从属mysql上，因为mysql对千万级别数据查询会变慢，导致mysql集群性能都会大大降低。

进一步改进方案，即数据库水平拆分及库表散列：

水平拆分一种方案：

比如有3个分片数据库服务器，每一个都有一个备机，每一组主机和备机数据都会同步。（至少一半的服务器效率浪费了）

（当资源有限时，可以把A分片数据库和B分片数据库的备机放在同一个服务器上，B数据库和C数据库的备机放到同一个服务器上....这样稳定性虽然降低了，服务器使用效率提高了）

然后一个用户表，因为id经常是数据库自动生成的，所以在新增用户数据的时候id是未知，不能根据id进行水平拆分。

可以根据用户用字段username.hashCode()返回一个int型数据，然后Math.abs()取绝对值，然后再% 1024取余数，这样获得的结果result就是0~1023

然后当0 <= result && result < 333时，把数据存放到第一个数据库，当333 <= result && result < 666时，把数据存放到第二个数据库，当666 <= result && result < 1024时，把数据存放到第三个数据库。

具体一些的代码：

①首先在spring配置文件application-context.xml中配置6个数据源：

<!-- 数据源1 --><bean id="dataSource1" class="com.mchange.v2.c3p0.ComboPooledDataSource"><property name="driverClass" value="${jdbc.driverClassName}" /><property name="jdbcUrl" value="${jdbc1.url}" /><property name="user" value="${jdbc1.username}" /><property name="password" value="${jdbc1.password}" /><property name="autoCommitOnClose" value="true"/><property name="initialPoolSize" value="${cpool.minPoolSize}"/><property name="minPoolSize" value="${cpool.minPoolSize}"/><property name="maxPoolSize" value="${cpool.maxPoolSize}"/><property name="maxIdleTime" value="${cpool.maxIdleTime}"/><property name="acquireIncrement" value="${cpool.acquireIncrement}"/><property name="maxIdleTimeExcessConnections" value="${cpool.maxIdleTimeExcessConnections}"/></bean><!-- 数据源2 --><bean id="dataSource2" class="com.mchange.v2.c3p0.ComboPooledDataSource"><property name="driverClass" value="${jdbc.driverClassName}" /><property name="jdbcUrl" value="${jdbc2.url}" /><property name="user" value="${jdbc2.username}" /><property name="password" value="${jdbc2.password}" /><property name="autoCommitOnClose" value="true"/><property name="initialPoolSize" value="${cpool.minPoolSize}"/><property name="minPoolSize" value="${cpool.minPoolSize}"/><property name="maxPoolSize" value="${cpool.maxPoolSize}"/><property name="maxIdleTime" value="${cpool.maxIdleTime}"/><property name="acquireIncrement" value="${cpool.acquireIncrement}"/><property name="maxIdleTimeExcessConnections" value="${cpool.maxIdleTimeExcessConnections}"/></bean>        一共类似6个

②引入配置的6个数据源（3组，每组一个主数据库一个备数据库）：

<!-- 配置数据源开始 -->    <bean id="dataSources" class="com.caland.sun.client.datasources.DefaultDataSourceService"><property name="dataSourceDescriptors"><set><bean class="com.caland.sun.client.datasources.DataSourceDescriptor"><property name="identity" value="partition1"/><!-- 指定数据源1 --><property name="targetDataSource" ref="dataSource1"/><!-- 对数据源1进行心跳检测 --><property name="targetDetectorDataSource" ref="dataSource1"/><!-- 指定备机数据源4 --><property name="standbyDataSource" ref="dataSource4"/><!-- 对备机进行心跳检测 --><property name="standbyDetectorDataSource" ref="dataSource4"/></bean><bean class="com.caland.sun.client.datasources.DataSourceDescriptor"><property name="identity" value="partition2"/><property name="targetDataSource" ref="dataSource2"/><property name="targetDetectorDataSource" ref="dataSource2"/><property name="standbyDataSource" ref="dataSource5"/><property name="standbyDetectorDataSource" ref="dataSource5"/></bean><bean class="com.caland.sun.client.datasources.DataSourceDescriptor"><property name="identity" value="partition3"/><property name="targetDataSource" ref="dataSource3"/><property name="targetDetectorDataSource" ref="dataSource3"/><property name="standbyDataSource" ref="dataSource6"/><property name="standbyDetectorDataSource" ref="dataSource6"/></bean></set></property><!-- HA配置，对数据库发送SQL语句：update caland set timeflag=CURRENT_TIMESTAMP()进行数据库状态检测 --><property name="haDataSourceCreator"><bean class="com.caland.sun.client.datasources.ha.FailoverHotSwapDataSourceCreator"><property name="detectingSql" value="update caland set timeflag=CURRENT_TIMESTAMP()"/></bean></property></bean>

③继续在application-context.xml中配置路由规则

<!-- 配置路由规则开始 --><!-- hash算法实现类 -->    <bean id="hashFunction" class="com.caland.core.dao.router.HashFunction"/><bean id="internalRouter"class="com.caland.sun.client.router.config.InteralRouterXmlFactoryBean"><!-- functionsMap是在使用自定义路由规则函数的时候使用 --><property name="functionsMap"><map><entry key="hash" value-ref="hashFunction"></entry></map>    </property><property name="configLocations"><list><!-- 路由规则文件 --><value>classpath:/dbRule/sharding-rules-on-namespace.xml</value></list></property></bean>

其中，sharding-rules-on-namespace.xml：

<rules><rule><namespace>User</namespace><!--  对用户名username调用自定义路由规则，如果返回的结果为1，则进入分片数据库1，以此类推1,2,3   表达式如果不使用自定义路由规则函数,而是直接使用   taobaoId%2==0这种的话就不用在文件   中配置<property name="functionsMap">中了--><shardingExpression>hash.applyUser(username) == 1</shardingExpression><shards>partition1</shards></rule><rule><namespace>User</namespace><shardingExpression>hash.applyUser(username) == 2</shardingExpression><shards>partition2</shards></rule><rule><namespace>User</namespace><shardingExpression>hash.applyUser(username) == 3</shardingExpression><shards>partition3</shards></rule></rules>

HashFunction.java:

public class HashFunction{/** * 对三个数据库进行散列分布 * 1、返回其他值，没有在配置文件中配置的，如负数等，在默认数据库中查找 * 2、比如现在配置文件中配置有三个结果进行散列，如果返回为0，那么apply方法只调用一次，如果返回为2， *   那么apply方法就会被调用三次，也就是每次是按照配置文件的顺序依次的调用方法进行判断结果，而不会缓存方法返回值进行判断 * @param id * @return */public int applyUser(String username) {//先从缓存获取 没有则查询数据库//input 可能是id，拿id到缓存里去查用户的DB坐标信息。然后把库的编号输出int result = Math.abs(username.hashCode() % 1024);//0---1023System.out.println("hash:" + result);//333if(0 <= result && result < 256){result = 1;System.out.println("在第1个数据库中");}if(256 <= result && result < 512){result = 2;System.out.println("在第2个数据库中");}if(512 <= result && result < 1024){result = 3;System.out.println("在第3个数据库中");}return result;}}

找了几个比较好的关于水平拆分的博客：

http://www.cnblogs.com/Creator/p/3776110.html

http://dryr.blog.163.com/blog/static/582110132010422115946413/

1 0