分库分表的排序
来源:互联网 发布:数据质量 图片 编辑:程序博客网 时间:2024/04/29 19:58
author:skate
time:2013/05/20
分库分表的排序
1. 对于单库,冗余一个汇总所有数据表,用于全部数据的排序,但是当数据量大,汇总表将会成为瓶颈。这不是一个很好的方案
2. 无论单库还是多个分库,都由程序读取需要数据并作排序。
排序的几种方式:
大都是按时间排序的,如果在客户端可以直接判断在哪个分表最好,可以直接读取指定分表并作排序
例如:
汇总表td_test_all;而分表是按companyid分表的
原始sql:
SELECT * FROM td_test_all
WHERE companyid = 15997
order by productid desc limit 0,20
程序端完全可以通过companyid判断在哪个分表读取数据,改为
SELECT * FROM td_test7
WHERE companyid = 15997
order by productid desc limit 0,20
这样数据的排序还是通过数据实现的。
如果where条件里没有分区字段的话,如何定位到具体分区呢?可以在设计阶段,在常用字段上埋下分区规则的种子, 比如在td_test7.groupid字段设计由int+7(7表示在分表td_test7里)
如果数据必须从多个分表取数据的话:
对于取top N条记录的话场景
程序分表读取每个分表的前N条记录(理想的认为数据都来源一个分表,从而减小结果集),如分区td_test0所示:
SELECT *
FROM td_test0
WHERE createtime> STR_TO_DATE('2013-04-28 15:34:02','%Y-%m-%d %H:%i:%s')
ORDER BY createtime DESC
LIMIT 0,5
然后程序读取这些结果集,在应用端汇总排序取top N记录
对于需要分页的话场景
这个就只能把每个分表、满足条件的的所有记录都load到应用端,然后在程序端很容易做汇总,排序分页操作
大家还有什么好的方法, 请补充.......
------end----
- 分库分表的排序
- 【排序】排序的基本概念
- 数组的排序:冒泡排序、选择排序
- 常用的排序算法:插入排序,希尔排序,冒泡排序,选择排序,快速排序,归并排序
- 单链表的排序(选择排序)
- 排序的之插入排序
- 简单的排序---选择排序
- 简单的排序---插入排序
- 简单的排序---堆排序
- 不是快速排序的排序
- 【排序】链表上的归并排序
- 堆排序 - 不稳定的排序
- 排序:一些排序的总结
- 有趣的排序-百度-排序
- 三种最基本的排序 选择排序 插入排序 冒泡排序
- java数组的排序,选择排序,冒泡排序,插入排序
- 基本的排序算法:冒泡排序、插入排序、希尔排序、选择排序、归并排序、快速排序、堆排序
- 各种常见的排序,冒泡排序,选择排序,插入排序,希尔排序,堆排序,快速排序,基数排序,桶排序
- 软考将近
- VC++ 创建字体的几种方法
- CSS and JavaScript tools to take your website to the next level(备用)
- C++第九周任务-项目三(分数类)
- Windows平台下配置Android的开发环境
- 分库分表的排序
- 谢耳朵最萌最贱表情, 哈哈
- bayer格式图像
- java多线程处理
- 学习倒计时
- XMPPFramework for NON-ARC Project
- CString成员函数用法大全
- iOS开发资源:FlatUIKit、MMDrawerController以及MZDayPicker等
- 用选择法对10个整数从小到大排序。