优化数据库的10个建议
来源:互联网 发布:航班延误 知乎 编辑:程序博客网 时间:2024/05/02 23:10
- 小心设计数据库
第一个技巧也许看来理所当然,但事实上大部分数据库的问题都来自于设计不好的数据库结构。譬如我曾经遇见过将客户端信息和支付信息储存在同一个数据库列中的例子。对于系统和用数据库的开发者来说,这很糟糕。新建数据库时,应当将信息储存在不同的表里,采用标准的命名方式,并采用主键。
想清楚需要优化的地方
如果你想优化某个查询语句,清楚的知道这个语句的结果是非常有帮助的。采用EXPLAIN语句,你将获得很多有用的信息,下面来看个例子:
- EXPLAIN SELECT * FROM ref_table,other_table WHERE ref_table.key_column=other_table.column;
- 将数据缓存起来
每次你向数据库发送一条语句,你都会用掉很多服务器资源。所以在很高流量的网站中,最好的方法是将你的查询语句缓存起来。Memcached:Memcached是一种分布式内存缓存系统,它可以减轻数据库的负载,来加速基于动态数据库的网站。
- 不要查询不需要的字段
获取想要的数据,一种非常常见的方式就是采用*字符,这会列出所有的列。
- SELECT * FROM wp_posts;
然而,你应该仅列出你需要的列,如下所示。如果在一个非常小型的网站,譬如,一分钟一个用户访问,可能没有什么分别。然而如果像Cats Who Code这样大流量的网站,这就为数据库省了很多事。
- ELECT title, excerpt, author FROM wp_posts;
- 采用limit
仅获得某个特定行数的数据是非常常见的。譬如博客每页只显示十篇文章。这时,你应该使用LIMIT,来限定你想选定的数据的行数。
如果没有LIMIT,表有100,000行数据,你将会遍历所有的行数,这对于服务器来说是不必要的负担。
- SELECT title, excerpt, author FROM wp_posts LIMIT 10 ;
- 避免循环中查询
当在PHP中使用SQL时,可以将SQL放在循环语句中。但这么做给你的数据库增加了负担。
下面的例子说明了“在循环语句中嵌套查询语句”的问题:
- foreach ($display_order as $id => $ordinal) {
- $sql = "UPDATE categories SET display_order = $ordinal WHERE id = $id" ;
- mysql_query($sql);
- }
- UPDATE categories
- SET display_order = CASE id
- WHEN 1 THEN 3
- WHEN 2 THEN 4
- WHEN 3 THEN 5
- END
- WHERE id IN ( 1 , 2 , 3 )
- 用join来替换子查询
程序员可能会喜欢用子查询,甚至滥用。下面的子查询非常有用:
- SELECT a.id,
- (SELECT MAX(created)
- FROM posts
- WHERE author_id = a.id)
- AS latest_post FROM authors a
虽然子查询很有用,但join语句可以替换它,join语句执行起来更快。
- SELECT a.id, MAX(p.created) AS latest_post
- FROM authors a
- INNER JOIN posts p
- ON (a.id = p.author_id)
- GROUP BY a.id
- 小心使用通配符
通配符非常好用,在搜索数据的时候可以用通配符来代替一个或多个字符。我不是说不能用,而是,应该小心使用,并且不要使用全词通配符(full wildcard),前缀通配符或后置通配符可以完成相同的任务。
事实上,在百万数量级的数据上采用全词通配符来搜索会让你的数据库当机。
- #Full wildcard
- SELECT * FROM TABLE WHERE COLUMN LIKE '%hello%' ;
- #Postfix wildcard
- SELECT * FROM TABLE WHERE COLUMN LIKE 'hello%' ;
- #Prefix wildcard
- SELECT * FROM TABLE WHERE COLUMN LIKE '%hello' ;
- 用union来代替or
下面的例子采用OR语句来:
- SELECT * FROM a, b WHERE a.p = b.q or a.x = b.y;
UNION语句,你可以将2个或更多select语句的结果拼在一起。下面的例子返回的结果同上面的一样,但是速度要快些:
- SELECT * FROM a, b WHERE a.p = b.q
- UNION
- SELECT * FROM a, b WHERE a.x = b.y
- 使用索引
数据库索引和你在图书馆中见到的索引类似:能让你更快速的获取想要的信息,正如图书馆中的索引能让读者更快的找到想要的书一样。
可以在一个列上创建索引,也可以在多个列上创建。索引是一种数据结构,它将表中的一列或多列的值以特定的顺序组织起来。
下面的语句在Product表的Model列上创建索引。这个索引的名字叫作idxModel
- CREATE INDEX idxModel ON Product (Model)
- 优化数据库的10个建议
- 服务器数据库系列 - 优化数据库的10个建议
- 搜罗的数据库优化建议
- 优化AWSTATS性能的7个建议
- jQuery性能优化的28个建议
- jQuery性能优化的28个建议
- jQuery性能优化的28个建议
- jQuery性能优化的28个建议
- jQuery性能优化的28个建议
- mysql优化的20个建议
- jQuery性能优化的28个建议
- jQuery性能优化的28个建议
- jQuery性能优化的28个建议
- jQuery性能优化的28个建议
- jquery性能优化的38个建议
- 优化MySQL的21个建议
- jQuery性能优化的28个建议
- jQuery性能优化的28个建议
- 在AutoCAD中使用Python——Through the Interface
- grep、egrep、fgrep命令
- MATLAB中求非方阵的广义逆矩阵
- Java中abstract和interface的区别
- UVA 10361 Automatic Poetry
- 优化数据库的10个建议
- 频繁绑定DataGridView的DataSource却不正常显示
- JAVA的String 类详解
- UVA 537 Artificial Intelligence?
- mutable关键字
- 学习模式----观察者模式(3)
- RHN yum command: Unable to read consumer identity Warning and Solution
- 恩恩,一个想法,初步实现了它~就剩封装了
- hdu 4614 Vases and Flowers 线段树