ORACLE SQL性能优化系列 4

来源:互联网 发布:密苏里大学 知乎 编辑:程序博客网 时间:2024/05/28 15:56

17. 使用表的别名(Alias)
当在SQL语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column.这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误.

(
译者注: Column歧义指的是由于SQL中不同的表具有相同的Column,SQL语句中出现这个Column,SQL解析器无法判断这个Column的归属)


18.
EXISTS替代IN
在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接.在这种情况下, 使用EXISTS(NOT EXISTS)通常将提高查询的效率.

低效:
SELECT  *  FROMEMP (
基础表)
WHERE  EMPNO> 0
     AND  DEPTNO IN  (SELECT  DEPTNO  FROM  DEPT   WHERELOC = ‘MELB')

高效:
SELECT   *  FROMEMP (
基础表)
WHERE  EMPNO> 0
    AND   EXISTS  (SELECT ‘X'  FROM DEPT WHERE DEPT.DEPTNO= EMP.DEPTNO
                                                                                  AND  LOC =‘MELB')

(
译者按: 相对来说,NOT EXISTS替换NOT IN 将更显著地提高效率,下一节中将指出)


19.
NOTEXISTS替代NOT IN
在子查询中,NOT IN子句将执行一个内部的排序和合并. 无论在哪种情况下,NOTIN都是最低效的(因为它对子查询中的表执行了一个全表遍历). 为了避免使用NOT IN,我们可以把它改写成外连接(Outer Joins)NOT EXISTS.
例如:

SELECT …   FROM  EMP
WHERE  DEPT_NO NOT IN (SELECT  DEPT_NO  FROM DEPT
                                               WHERE   DEPT_CAT='A');

为了提高效率.改写为:
(
方法一: 高效)
SELECT ….   FROM  EMP A,  DEPT  B
WHERE   A.DEPT_NO = B.DEPT(+)
    AND   B.DEPT_NOIS NULL
    AND   B.DEPT_CAT(+)= ‘A'

(
方法二: 最高效)
SELECT ….   FROM  EMP E
WHERE   NOTEXISTS (SELECT   ‘X'   FROM  DEPT D
                                       WHERE   D.DEPT_NO= E.DEPT_NO
                                             AND   DEPT_CAT= ‘A');


20.
用表连接替换EXISTS
通常来说, 采用表连接的方式比EXISTS更有效率

SELECT  ENAME  FROMEMP E  
                             WHERE EXISTS(SELECT  ‘X'   FROM DEPT
                                                           WHERE   DEPT_NO= E.DEPT_NO
                                                                 AND   DEPT_CAT= ‘A');

(
更高效)
SELECT   ENAME  FROM  DEPT  D,  EMP   E
WHERE   E.DEPT_NO= D.DEPT_NO
    AND    DEPT_CAT= ‘A' ;

(
译者按: RBO的情况下,前者的执行路径包括FILTER,后者使用NESTED LOOP)


21.
EXISTS替换DISTINCT
当提交一个包含一对多表信息(比如部门表和雇员表)的查询时,避免在SELECT子句中使用DISTINCT. 一般可以考虑用EXIST替换
例如:

低效:
SELECT   DISTINCT  DEPT_NO, DEPT_NAME
   FROM   DEPT D,EMPE
WHERE    D.DEPT_NO= E.DEPT_NO

高效:
SELECT  DEPT_NO,DEPT_NAME
  FROM  DEPTD
WHERE  EXISTS ( SELECT  ‘X'   FROMEMP   E
                               WHERE  E.DEPT_NO =D.DEPT_NO);

EXISTS
使查询更为迅速,因为RDBMS核心模块将在子查询的条件一旦满足后,立刻返回结果.


22.
识别'低效执行'SQL语句
用下列SQL工具找出低效SQL:

SELECT   EXECUTIONS,  DISK_READS,BUFFER_GETS,
                ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2)  Hit_radio,
                ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run,
                SQL_TEXT
   FROM   V$SQLAREA
WHERE    EXECUTIONS> 0
    AND    BUFFER_GETS> 0
  AND   (BUFFER_GETS-DISK_READS)/BUFFER_GETS<  0.8
ORDER BY  4 DESC;

(
译者按: 虽然目前各种关于SQL优化的图形化工具层出不穷,但是写出自己的SQL工具来解决问题始终是一个最好的方法)


23.
使用TKPROF 工具来查询SQL性能状态
SQL trace
工具收集正在执行的SQL的性能状态数据并记录到一个跟踪文件中. 这个跟踪文件提供了许多有用的信息,例如解析次数.执行次数,CPU使用时间等.这些数据将可以用来优化你的系统.

设置SQLTRACE在会话级别: 有效
ALTER SESSION SET SQL_TRACE TRUE

设置SQL TRACE在整个数据库有效仿,你必须将SQL_TRACE参数在init.ora中设为TRUE, USER_DUMP_DEST参数说明了生成跟踪文件的目录

(
译者按: 这一节中,作者并没有提到TKPROF的用法, SQLTRACE的用法也不够准确, 设置SQLTRACE首先要在init.ora中设定TIMED_STATISTICS, 这样才能得到那些重要的时间状态.生成的trace文件是不可读的,所以要用TKPROF工具对其进行转换,TKPROF有许多执行参数. 大家可以参考ORACLE手册来了解具体的配置. )

 24. EXPLAIN PLAN 分析SQL语句
EXPLAIN PLAN是一个很好的分析SQL语句的工具,它甚至可以在不执行SQL的情况下分析语句. 通过分析,我们就可以知道ORACLE是怎么样连接表,使用什么方式扫描表(索引扫描或全表扫描)以及使用到的索引名称.

你需要按照从里到外,从上到下的次序解读分析的结果. EXPLAIN PLAN分析的结果是用缩进的格式排列的, 最内部的操作将被最先解读,如果两个操作处于同一层中,带有最小操作号的将被首先执行.

NESTED LOOP
是少数不按照上述规则处理的操作, 正确的执行路径是检查对NESTEDLOOP提供数据的操作,其中操作号最小的将被最先处理.

译者按:
通过实践, 感到还是用SQLPLUS中的SET TRACE 功能比较方便.
举例:

SQL> list
1 SELECT *
2 FROM dept, emp
3* WHERE emp.deptno = dept.deptno
SQL> set autotrace traceonly
SQL> /
14 rows selected.
Execution Plan
----------------------------------------------------------
0 SELECT STATEMENT Optimizer=CHOOSE
1 0 NESTED LOOPS
2 1 TABLE ACCESS (FULL) OF 'EMP'
3 1 TABLE ACCESS (BY INDEX ROWID) OF 'DEPT'
4 3 INDEX (UNIQUE SCAN) OF 'PK_DEPT' (UNIQUE)

Statistics
----------------------------------------------------------
0 recursive calls
2 db block gets
30 consistent gets
0 physical reads
0 redo size
2598 bytes sent via SQL*Net to client
503 bytes received via SQL*Net from client
2 SQL*Net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
14 rows processed


通过以上分析,可以得出实际的执行步骤是:

1. TABLE ACCESS (FULL) OF 'EMP'
2. INDEX (UNIQUE SCAN) OF 'PK_DEPT' (UNIQUE)
3. TABLE ACCESS (BY INDEX ROWID) OF 'DEPT'
4. NESTED LOOPS (JOINING 1 AND 3)

: 目前许多第三方的工具如TOADORACLE本身提供的工具如OMSSQL Analyze都提供了极其方便的EXPLAIN PLAN工具.也许喜欢图形化界面的朋友们可以选用它们

0 0