PL/SQL批处理语句:BULK COLLECT 和 FORALL对优化的贡献

来源:互联网 发布:敦煌博物馆 淘宝 编辑:程序博客网 时间:2024/05/17 20:34
我们知道PL/SQL程序中运行SQL语句是存在开销的,因为SQL语句是要提交给SQL引擎处理
       这种在PL/SQL引擎和SQL引擎之间的控制转移叫做上下文却换,每次却换时,都有额外的开销

       请看下图:

       

       但是,FORALL和BULK COLLECT可以让PL/SQL引擎把多个上下文却换压缩成一个,这使得在PL/SQL中的要处理多行记录的SQL语句执行的花费时间骤降
       请再看下图:

       

       下面详解这爷俩
       
       ㈠ 通过BULK COLLECT 加速查询
          
          ⑴ BULK COLLECT 的用法

             
             采用BULK COLLECT可以将查询结果一次性地加载到collections中,而不是通过cursor一条一条地处理
             可以在select into ,fetch into , returning into语句使用BULK COLLECT
             注意在使用BULK COLLECT时,所有的INTO变量都必须是collections
             
             举几个简单例子:
             
             ① 在select into语句中使用bulk collect

[sql] view plain copy
 print?
  1. DECLARE   
  2.   TYPE sallist IS TABLE OF employees.salary%TYPE;  
  3.   sals sallist;  
  4. BEGIN  
  5.   SELECT salary BULK COLLECT INTO sals FROM employees where rownum<=50;  
  6.   --接下来使用集合中的数据  
  7. END;  
  8. /  

             ② 在fetch into中使用bulk collect

[sql] view plain copy
 print?
  1. DECLARE  
  2.   TYPE deptrectab IS TABLE OF departments%ROWTYPE;  
  3.   dept_recs deptrectab;  
  4.   CURSOR cur IS SELECT department_id,department_name FROM departments where department_id>10;  
  5. BEGIN  
  6.   OPEN cur;  
  7.   FETCH cur BULK COLLECT INTO dept_recs;  
  8.   --接下来使用集合中的数据  
  9. END;  
  10. /  

             ③ 在returning into中使用bulk collect

[sql] view plain copy
 print?
  1. CREATE TABLE emp AS SELECT * FROM employees;  
  2.   
  3. DECLARE   
  4.   TYPE numlist IS TABLE OF employees.employee_id%TYPE;  
  5.   enums numlist;  
  6.   TYPE namelist IS TABLE OF employees.last_name%TYPE;  
  7.   names namelist;  
  8. BEGIN  
  9.   DELETE emp WHERE department_id=30  
  10.   RETURNING employee_id,last_name BULK COLLECT INTO enums,names;  
  11.   DBMS_OUTPUT.PUT_LINE('deleted'||SQL%ROWCOUNT||'rows:');  
  12.   FOR i IN enums.FIRST .. enums.LAST  
  13.     LOOP  
  14.       DBMS_OUTPUT.PUT_LINE('employee#'||enums(i)||':'||names(i));  
  15.     END LOOP;  
  16. END;  
  17. /  
  18.   
  19. deleted6rows:  
  20. employee#114:Raphaely  
  21. employee#115:Khoo  
  22. employee#116:Baida  
  23. employee#117:Tobias  
  24. employee#118:Himuro  
  25. employee#119:Colmenares  

          ⑵ BULK COLLECT 对大数据DELETE UPDATE的优化
             
             这里举DELETE就可以了,UPDATE同理
             
             举个案例:
             需要在一个1亿行的大表中,删除1千万行数据
             需求是在对数据库其他应用影响最小的情况下,以最快的速度完成
             
             如果业务无法停止的话,可以参考下列思路:
             根据ROWID分片、再利用Rowid排序、批量处理、回表删除
             在业务无法停止的时候,选择这种方式,的确是最好的
             一般可以控制在每一万行以内提交一次,不会对回滚段造成太大压力
             我在做大DML时,通常选择一两千行一提交
             选择业务低峰时做,对应用也不至于有太大影响
             代码如下:

[sql] view plain copy
 print?
  1. DECLARE  
  2. --按rowid排序的cursor  
  3. --删除条件是oo=xx,这个需根据实际情况来定  
  4.  CURSOR mycursor IS SELECT rowid FROM t WHERE OO=XX ORDER BY rowid;  
  5.  TYPE rowid_table_type IS TABLE OF rowid index  by  pls_integer;  
  6.  v_rowid rowid_table_type;  
  7. BEGIN  
  8.   OPEN mycursor;  
  9.   LOOP  
  10.     FETCH mycursor BULK COLLECT INTO v_rowid LIMIT 5000;--5000行提交一次  
  11.     EXIT WHEN v_rowid.count=0;  
  12.     FORALL i IN v_rowid.FIRST..v_rowid.LAST  
  13.       DELETE t WHERE rowid=v_rowid(i);  
  14.     COMMIT;  
  15.   END LOOP;  
  16.   CLOSE mycursor;  
  17. END;  
  18. /  

          ⑶ 限制BULK COLLECT 提取的记录数
             
             语法:
             FETCH cursor BULK COLLECT INTO ...[LIMIT rows];
             其中,rows可以是常量,变量或者求值的结果是整数的表达式
             
             假设你需要查询并处理1W行数据,你可以用BULK COLLECT一次取出所有行,然后填充到一个非常大的集合中
             可是,这种方法会消耗该会话的大量PGA,APP可能会因为PGA换页而导致性能下降
             
             这时,LIMIT子句就非常有用,它可以帮助我们控制程序用多大内存来处理数据
             
             例子:

[sql] view plain copy
 print?
  1. DECLARE  
  2.   CURSOR allrows_cur IS SELECT * FROM employees;  
  3.   TYPE employee_aat IS TABLE OF allrows_cur%ROWTYPE INDEX BY BINARY_INTEGER;  
  4.   v_emp employee_aat;  
  5. BEGIN  
  6.   OPEN allrows_cur;  
  7.   LOOP  
  8.     FETCH allrows_cur BULK FETCH INTO v_emp LIMIT 100;  
  9.       
  10.     /*通过扫描集合对数据进行处理*/  
  11.     FOR i IN 1 .. v_emp.count  
  12.       LOOP  
  13.         upgrade_employee_status(v_emp(i).employee_id);  
  14.       END LOOP;  
  15.       
  16.     EXIT WHEN allrows_cur%NOTFOUND;  
  17.   END LOOP;  
  18.     
  19.   CLOSE allrows_cur;  
  20. END;  
  21. /  

          ⑷ 批量提取多列
             
             需求:
             提取transportation表中的油耗小于 20公里/RMB的交通具体的全部信息
             代码如下:

[sql] view plain copy
 print?
  1. DECLARE  
  2.   --声明集合类型  
  3.   TYPE vehtab IS TABLE OF transportation%ROWTYPE;  
  4.   --初始化一个这个类型的集合  
  5.   gas_quzzlers vehtab;  
  6. BEGIN  
  7.   SELECT * BULK COLLECT INTO gas_quzzlers FROM transportation WHERE mileage  < 20;  
  8.   ...  

          ⑸ 对批量操作使用RETURNING子句
             
             有了returning子句后,我们可以轻松地确定刚刚完成的DML操作的结果,无须再做额外的查询工作
             例子请见BULK COLLECT 的用法的第三小点
             
             
       ㈡ 通过FORALL 加速DML
          
          FORALL告诉PL/SQL引擎要先把一个或多个集合的所有成员都绑定到SQL语句中,然后再把语句发送给SQL引擎
          
          ⑴ 语法

          未完待续,,,

转:http://blog.csdn.net/dba_waterbin/article/details/8581448

0 0
原创粉丝点击