oracle优化

来源:互联网 发布:成都行知幼稚园 编辑:程序博客网 时间:2024/06/03 17:11
1. 选择最有效率的表名顺序(只在基于规则的优化器中有效)
   ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,因此FROM子句中写在最后的表(基础表 driving table)将被最先处理。 在FROM子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表。当ORACLE处理多个表时, 会运用排序及合并的方式连接它们。首先,扫描第一个表(FROM子句中最后的那个表)并对记录进行派序,然后扫描第二个表(FROM子句中最后第二个表),最后将所有从第二个表中检索出的记录与第一个表中合适记录进行合并。
   例如:
      表 TAB1 16,384 条记录
      表 TAB2 1      条记录
      选择TAB2作为基础表 (最好的方法)
select count(*) from tab1,tab2   执行时间0.96秒
      选择TAB2作为基础表 (不佳的方法)
select count(*) from tab2,tab1   执行时间26.09秒
      如果有3个以上的表连接查询, 那就需要选择交叉表(intersection table)作为基础表, 交叉表是指那个被其他表所引用的表。
    例如:EMP表描述了LOCATION表和CATEGORY表的交集。
SELECT *
  FROM LOCATION L, CATEGORY C, EMP E
 WHERE E.EMP_NO BETWEEN 1000 AND 2000
   AND E.CAT_NO = C.CAT_NO
   AND E.LOCN = L.LOCN
   将比下列SQL更有效率
SELECT *
  FROM EMP E, LOCATION L, CATEGORY C
 WHERE E.CAT_NO = C.CAT_NO
   AND E.LOCN = L.LOCN

   AND E.EMP_NO BETWEEN 1000 AND 2000

2.WHERE子句中的连接顺序。 
   ORACLE采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他WHERE条件之前, 那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。
   例如:
  (低效,执行时间156.3秒)
SELECT *
  FROM EMP E
 WHERE SAL > 50000
   AND JOB = 'MANAGER'
   AND 25 < (SELECT COUNT(*) FROM EMP WHERE MGR = E.EMPNO);
   (高效,执行时间10.6秒)
SELECT *
  FROM EMP E
 WHERE 25 < (SELECT COUNT(*) FROM EMP WHERE MGR = E.EMPNO)
   AND SAL > 50000
   AND JOB = 'MANAGER';

3.SELECT子句中避免使用 '*'
  当你想在SELECT子句中列出所有的COLUMN时,使用动态SQL列引用 '*' 是一个方便的方法。不幸的是,这是一个非常低效的方法。 实际上,ORACLE在解析的过程中, 会将'*' 依次转换成所有的列名, 这个工作是通过查询数据字典完成的, 这意味着将耗费更多的时间。

4.减少访问数据库的次数
  当执行每条SQL语句时, ORACLE在内部执行了许多工作: 解析SQL语句, 估算索引的利用率, 绑定变量 , 读数据块等等。 由此可见, 减少访问数据库的次数 , 就能实际上减少ORACLE的工作量。
    例如,以下有三种方法可以检索出雇员号等于0342或0291的职员。
    方法1 (最低效)
SELECT EMP_NAME, SALARY, GRADE FROM EMP WHERE EMP_NO = 342;
SELECT EMP_NAME, SALARY, GRADE FROM EMP WHERE EMP_NO = 291;
    方法2 (次低效)
DECLARE
  CURSOR C1(E_NO NUMBER) IS
    SELECT EMP_NAME, SALARY, GRADE FROM EMP WHERE EMP_NO = E_NO;
BEGIN
  OPEN C1(342);
  FETCH C1
    INTO …,..,..;
  OPEN C1(291);
  FETCH C1
    INTO …,..,..;
  CLOSE C1;
END;
    方法3 (高效)
SELECT A.EMP_NAME, A.SALARY, A.GRADE, B.EMP_NAME, B.SALARY, B.GRADE
  FROM EMP A, EMP B
 WHERE A.EMP_NO = 342
   AND B.EMP_NO = 291;
   注意:
   在SQL*Plus , SQL*Forms和Pro*C中重新设置ARRAYSIZE参数, 可以增加每次数据库访问的检索数据量 ,建议值为200.
5.使用DECODE函数来减少处理时间
  使用DECODE函数可以避免重复扫描相同记录或重复连接相同的表。
   例如:
SELECT COUNT(*),
       SUM(SAL) FROM EMP WHERE DEPT_NO = 0020 AND ENAME LIKE  'SMITH%';
SELECT COUNT(*),
       SUM(SAL) FROM EMP WHERE DEPT_NO = 0030 AND ENAME LIKE  'SMITH%';
  可以用DECODE函数高效地得到相同结果
SELECT COUNT(DECODE(DEPT_NO, 0020, 'X', NULL)) D0020_COUNT,
       COUNT(DECODE(DEPT_NO, 0030, 'X', NULL)) D0030_COUNT,
       SUM(DECODE(DEPT_NO, 0020, SAL, NULL)) D0020_SAL,
       SUM(DECODE(DEPT_NO, 0030, SAL, NULL)) D0030_SAL
  FROM EMP
 WHERE ENAME LIKE 'SMITH%';
  类似的,DECODE函数也可以运用于GROUP BY 和ORDER BY子句中。

6.用TRUNCATE替代DELETE
   当删除表中的记录时,在通常情况下, 回滚段(rollback segments ) 用来存放可以被恢复的信息。 如果你没有COMMIT事务,ORACLE会将数据恢复到删除之前的状态(准确地说是恢复到执行删除命令之前的状况)
    而当运用TRUNCATE时, 回滚段不再存放任何可被恢复的信息。当命令运行后,数据不能被恢复。因此很少的资源被调用,执行时间也会很短。
    TRUNCATE只在删除全表适用,TRUNCATE是DDL不是DML

7.尽量多使用COMMIT
   只要有可能,在程序中尽量多使用COMMIT, 这样程序的性能得到提高,需求也会因为COMMIT所释放的资源而减少:COMMIT所释放的资源:
   a.回滚段上用于恢复数据的信息。
    b.被程序语句获得的锁
   c.redo log buffer 中的空间
   d.ORACLE为管理上述3种资源中的内部花费
   在使用COMMIT时必须要注意到事务的完整性,现实中效率和事务完整性往往是鱼和熊掌不可得兼

8.用Where子句替换HAVING子句
   避免使用HAVING子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤。 这个处理需要排序,总计等操作。 如果能通过WHERE子句限制记录的数目,那就能减少这方面的开销。
    例如:
 低效:
     SELECT REGION, AVG(LOG_SIZE)
       FROM LOCATION
      GROUP BY REGION
     HAVING REGION REGION != 'SYDNEY' AND REGION != 'PERTH'
 高效
     SELECT REGION, AVG(LOG_SIZE)
       FROM LOCATION
      WHERE REGION REGION != 'SYDNEY'
        AND REGION != 'PERTH'
      GROUP BY REGION
    HAVING 中的条件一般用于对一些集合函数的比较,如COUNT() 等等。 除此而外,一般的条件应该写在WHERE子句中

9.使用表的别名(Alias)
    当在SQL语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column上。这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误。
    Column歧义指的是由于SQL中不同的表具有相同的Column名,当SQL语句中出现这个Column时,SQL解析器无法判断这个Column的归属

10.用EXISTS替代IN
   在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接。在这种情况下, 使用EXISTS(或NOT EXISTS)通常将提高查询的效率。
    低效:
SELECT *
  FROM EMP(基础表)
 WHERE EMPNO > 0
   AND DEPTNO IN (SELECT DEPTNO FROM DEPT WHERE LOC = 'MELB')
    高效:
SELECT *
  FROM EMP(基础表)
 WHERE EMPNO > 0
   AND EXISTS (SELECT 'X'
          FROM DEPT
         WHERE DEPT.DEPTNO = EMP.DEPTNO
           AND LOC = 'MELB')

11. 用NOT EXISTS替代NOT IN
   在子查询中,NOT IN子句将执行一个内部的排序和合并。 无论在哪种情况下,NOT IN都是最低效的 (因为它对子查询中的表执行了一个全表遍历)。  为了避免使用NOT IN ,我们可以把它改写成外连接(Outer Joins)或NOT EXISTS.
 例如:
SELECT *
  FROM EMP
 WHERE DEPT_NO NOT IN (SELECT DEPT_NO FROM DEPT WHERE DEPT_CAT = 'A');
   为了提高效率。改写为:
 (方法一: 高效)
SELECT *
  FROM EMP A, DEPT B
 WHERE A.DEPT_NO = B.DEPT(+)
   AND B.DEPT_NO IS NULL
   AND B.DEPT_CAT(+) = 'A'
 (方法二: 最高效)
SELECT *
  FROM EMP E
 WHERE NOT EXISTS (SELECT 'X'
          FROM DEPT D
         WHERE D.DEPT_NO = E.DEPT_NO
           AND DEPT_CAT = 'A');

12.用表连接替换EXISTS
   通常来说 , 采用表连接的方式比EXISTS更有效率
      SELECT ENAME
        FROM EMP E
       WHERE EXISTS (SELECT 'X'
                FROM DEPT
               WHERE DEPT_NO = E.DEPT_NO
                 AND DEPT_CAT = 'A');
   (更高效)
      SELECT ENAME
        FROM DEPT D, EMP E
       WHERE E.DEPT_NO = D.DEPT_NO
         AND DEPT_CAT = 'A';
   在RBO的情况下,前者的执行路径包括FILTER,后者使用NESTED LOOP

13.用EXISTS替换DISTINCT
   当提交一个包含一对多表信息(比如部门表和雇员表)的查询时,避免在SELECT子句中使用DISTINCT. 一般可以考虑用EXIST替换
 例如:
 低效:
   SELECT DISTINCT DEPT_NO, DEPT_NAME
     FROM DEPT D, EMP E
    WHERE D.DEPT_NO = E.DEPT_NO
 高效:
    SELECT DEPT_NO, DEPT_NAME
      FROM DEPT D
     WHERE EXISTS (SELECT 'X' FROM EMP E WHERE E.DEPT_NO = D.DEPT_NO);
 EXISTS 使查询更为迅速,因为RDBMS核心模块将在子查询的条件一旦满足后,立刻返回结果。


0 0
原创粉丝点击