MySQL 随机取数据效率问题
来源:互联网 发布:软件缘 编辑:程序博客网 时间:2024/04/29 21:44
本文详细解说了MySQL Order By Rand()效率优化的方案,并给出了优化的思路过程,是篇不可多得的MySQL Order By Rand()效率美文。
最近由于需要大概研究了一下MYSQL的随机抽取实现方法。举个例子,要从tablename表中随机提取一条记录,大家一般的写法就是:SELECT * FROM tablename ORDER BY RAND() LIMIT 1。
但是,后来我查了一下MYSQL的官方手册,里面针对RAND()的提示大概意思就是,在ORDER BY从句里面不能使用RAND()函数,因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中,仍然可以通过ORDER BY RAND()来实现随机。
但是真正测试一下才发现这样效率非常低。一个15万余条的库,查询5条数据,居然要8秒以上。查看官方手册,也说rand()放在ORDER BY 子句中会被执行多次,自然效率及很低。
You cannot use a column with RAND() values in an ORDER BY clause, because ORDER BY would evaluate the column multiple times.
SELECT *
FROM `table` AS t1 JOIN (SELECT ROUND(RAND() * (SELECT MAX(id) FROM `table`)) AS id) AS t2
WHERE t1.id >= t2.id
ORDER BY t1.id ASC LIMIT 5;
下面的语句采用的是JOIN,mysql的论坛上有人使用
SELECT *
FROM `table`
WHERE id >= (SELECT FLOOR( MAX(id) * RAND()) FROM `table` )
ORDER BY id LIMIT 1;
于是我把语句改写了一下。
SELECT * FROM `table`
WHERE id >= (SELECT floor(RAND() * (SELECT MAX(id) FROM `table`)))
ORDER BY id LIMIT 1;
最后,再把语句完善一下,加上MIN(id)的判断。我在最开始测试的时候,就是因为没有加上MIN(id)的判断,结果有一半的时间总是查询到表中的前面几行。
完整查询语句是:
SELECT * FROM `table`
WHERE id >= (SELECT floor( RAND() * ((SELECT MAX(id) FROM `table`)-(SELECT MIN(id) FROM `table`)) + (SELECT MIN(id) FROM `table`)))
ORDER BY id LIMIT 1;
SELECT *
FROM `table` AS t1 JOIN (SELECT ROUND(RAND() * ((SELECT MAX(id) FROM `table`)-(SELECT MIN(id) FROM `table`))+(SELECT MIN(id) FROM `table`)) AS id) AS t2
WHERE t1.id >= t2.id
ORDER BY t1.id LIMIT 1;
前者花费时间 0.147433 秒
后者花费时间 0.015130 秒
看来采用JOIN的语法比直接在WHERE中使用函数效率还要高很多。
参考文献:
MySQL Order By索引优化:http://www.phpq.net/mysql/mysql-order-by.html
MySQL Order By语法:http://www.phpq.net/mysql/mysql-order-by-syntax.html
MySQL Order By Rand()效率:http://www.phpq.net/mysql/mysql-order-by-rand.html
MySQL Order By用法:http://www.phpq.net/mysql/mysql-order-by-use.html
- MySQL 随机取数据效率问题
- MySQL 随机取数据效率问题
- MySQL 获取随机取数据方法及其效率
- mysql随机取数据
- mysql随机取数据
- mysql随机取数据
- mysql 随机取一组数据
- mysql 随机取数据 高效
- mysql如何随机取数据
- mysql中取随机数据
- MySQL中随机获取数据以及效率
- mysql随机取数据,如何实现高效率?
- 随机取mysql的N条数据
- mysql随机取数据,如何实现高效率?
- Mysql 表中随机取数据记录
- MySql 随机取数据(简单版)
- MySQL随机取元素
- mysql随机取数
- TabHost注意
- 通过用AcDbObject或者AcDbEntity派生的类,无法用代理直接取代
- uboot-2011.12移植到S3C2440(序五)——ARM寄存器说明
- .net Form验证时的退出页面
- mysql 中 时间和日期函数
- MySQL 随机取数据效率问题
- enocean
- 如何在GridView中根据状态绑定相关图片(如1为对号,2为叉)
- Java Object类中方法理解
- hook iat 简单示例
- 文本编辑器的粗略设计
- 一个关于Eclipse问题的解决
- 在公共类,一般处理程序或BLL中应用Page或Session对象,省事.
- liunx boot up process