深入理解Oracle的并行操作

来源：互联网发布：微耕门禁数据库表结构编辑：程序博客网时间：2024/04/27 21:55

并行（Parallel）和OLAP系统

并行的实现机制是：首先，Oracle会创建一个进程用于协调并行服务进程之间的信息传递，这个协调进程将需要操作的数据集（比如表的数据块）分割成很多部分，称为并行处理单元，然后并行协调进程给每个并行进程分配一个数据单元。比如有四个并行服务进程，他们就会同时处理各自分配的单元，当一个并行服务进程处理完毕后，协调进程就会给它们分配另外的单元，如此反复，直到表上的数据都处理完毕，最后协调进程负责将每个小的集合合并为一个大集合作为最终的执行结果，返回给用户。
并行处理的机制实际上就是把一个要扫描的数据集分成很多小数据集，Oracle会启动几个并行服务进程同时处理这些小数据集，最后将这些结果汇总，作为最终的处理结果返回给用户。
这种数据并行处理方式在OLAP系统中非常有用，OLAP系统的表通常来说都是非常大，如果系统的CPU比较多，让所有的CPU共同来处理这些数据，效果就会比串行执行要高得多。
然而对于OLTP系统，通常来讲，并行并不合适，原因是OLTP系统上几乎在所有的SQL操作中，数据访问路径基本上以索引访问为主，并且返回结果集非常小，这样的SQL操作的处理速度一般非常快，不需要启用并行。
并行处理的机制
当Oracle数据库启动的时候，实例会根据初始化参数 PARALLEL_MIN_SERVERS=n的值来预先分配n个并行服务进程，当一条SQL被CBO判断为需要并行执行时发出SQL的会话进程变成并行协助进程，它按照并行执行度的值来分配进程服务器进程。
首先协调进程会使用ORACLE启动时根据参数： parallel_min_servers=n的值启动相应的并行服务进程，如果启动的并行服务器进程数不足以满足并行度要求的并行服务进程数，则并行协调进程将额外启动并行服务进程以提供更多的并行服务进程来满足执行的需求。然后并行协调进程将要处理的对象划分成小数据片，分给并行服务进程处理；并行服务进程处理完毕后将结果发送给并行协调进程，然后由并行协调进程将处理结果汇总并发送给用户。
刚才讲述的是一个并行处理的基本流程。实际上，在一个并行执行的过程中，还存在着并行服务进程之间的通信问题。
在一个并行服务进程需要做两件事情的时候，它会再启用一个进程来配合当前的进程完成一个工作，比如这样的一条SQL语句：
Select * from employees order by last_name;
假设employees表中last_name列上没有索引，并且并行度为4，此时并行协调进程会分配4个并行服务进程对表employees进行全表扫描操作，因为需要对结果集进行排序，所以并行协调进程会额外启用4个并行服务进程，用于处理4个进程传送过来的数据，这新启用的用户处理传递过来数据的进程称为父进程，用户传出数据（最初的4个并行服务进程）称为子进程，这样整个并行处理过程就启用了8个并行服务进程。其中每个单独的并行服务进程的行为叫作并行的内部操作，而并行服务进程之间的数据交流叫做并行的交互操作。
这也是有时我们发现并行服务进程数量是并行度的2倍，就是因为启动了并行服务父进程操作的缘故。
读懂一个并行处理的执行计划
CREATE TABLE emp2 AS SELECT * FROM employees;
ALTER TABLE emp2 PARALLEL 2;
EXPLAIN PLAN FOR SELECT SUM(salary) FROM emp2 GROUP BY department_id;
SQL> select * from table(dbms_xplan.display);
PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Plan hash value: 3939201228
------------------------------------------------------------------------------------------------------------------
| Id | Operation                | Name     | Rows | Bytes | Cost (%CPU)| Time     |    TQ |IN-OUT| PQ Distrib |
------------------------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT         |          |   107 | 2782 |     3 (34)| 00:00:01 |        |      |            |
|   1 | PX COORDINATOR          |          |       |       |            |          |        |      |            |
|   2 |   PX SEND QC (RANDOM)    | :TQ10001 |   107 | 2782 |     3 (34)| 00:00:01 | Q1,01 | P->S | QC (RAND) |
|   3 |    HASH GROUP BY         |          |   107 | 2782 |     3 (34)| 00:00:01 | Q1,01 | PCWP |            |
|   4 |     PX RECEIVE           |          |   107 | 2782 |     3 (34)| 00:00:01 | Q1,01 | PCWP |            |
|   5 |      PX SEND HASH        | :TQ10000 |   107 | 2782 |     3 (34)| 00:00:01 | Q1,00 | P->P | HASH       |
PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
|   6 |       HASH GROUP BY      |          |   107 | 2782 |     3 (34)| 00:00:01 | Q1,00 | PCWP |            |
|   7 |        PX BLOCK ITERATOR |          |   107 | 2782 |     2   (0)| 00:00:01 | Q1,00 | PCWC |            |
|   8 |         TABLE ACCESS FULL| EMP2     |   107 | 2782 |     2   (0)| 00:00:01 | Q1,00 | PCWP |            |
------------------------------------------------------------------------------------------------------------------
Note
-----
   - dynamic sampling used for this statement
19 rows selected.
通过执行计划，我们来看一下它的执行步骤：
1、并行服务进程对EMP2表进行全表扫描。
2、并行服务进程以ITERATOR（迭代）方式访问数据块，也就是并行协调进程分给每个并行服务进程一个数据片，在这个数据片上，并行服务进程顺序地访问每个数据块（Iterator），所有的并行服务进程将扫描的数据块传给另一组并行服务进程（父进程）用于做Hash Group操作。
3、并行服务父进程对子进程传递过来的数据做Hash Group操作。
4、并行服务进程（子进程）将处理完的数据发送出去。
5、并行服务进程（父进程）接收到处理过的数据。
6、合并处理过的数据，按照随机的顺序发给并行协调进程（QC：Query Conordinator）。
7、并行协调进程将处理结果发给用户。
当使用了并行执行，SQL的执行计划中就会多出一列：in-out。该列帮助我们理解数据流的执行方法。它的一些值的含义如下：
Parallel to Serial（P->S）: 表示一个并行操作发送数据给一个串行操作，通常是并行incheng将数据发送给并行调度进程。
Parallel to Parallel（P->P）：表示一个并行操作向另一个并行操作发送数据，通常是两个从属进程之间的数据交流。
Parallel Combined with parent(PCWP): 同一个从属进程执行的并行操作，同时父操作也是并行的。
Parallel Combined with Child(PCWC): 同一个从属进程执行的并行操作，子操作也是并行的。
Serial to Parallel（S->P）: 一个串行操作发送数据给并行操作，如果select部分是串行操作，就会出现这个情况。
并行执行等待事件
在做并行执行方面的性能优化的时候，可能会遇到如下等待事件
PX Deq Credit: send blkd
这是一个有并行环境的数据库中，从statspack 或者AWR中经常可以看到的等待事件。在Oracle 9i 里面，这个等待时间被列入空闲等待。
一般来说空闲等待可以忽略它，但是实际上空闲等待也是需要关注的，因为一个空闲的等待，它反映的是另外的资源已经超负荷运行了。基于这个原因，在Oracle 10g里已经把PX Deq Credit: send blkd等待时间不再视为空闲等待，而是列入了Others 等待事件范围。
PX Deq Credit: send blkd 等待事件的意思是：当并行服务进程向并行协调进程QC（也可能是上一层的并行服务进程）发送消息时，同一时间只有一个并行服务进程可以向上层进程发送消息，这时候如果有其他的并行服务进程也要发送消息，就只能等待了。直到获得一个发送消息的信用信息（Credit），这时候会触发这个等待事件，这个等待事件的超时时间为2秒钟。
如果我们启动了太多的并行进程，实际上系统资源（CPU）或者QC 无法即时处理并行服务发送的数据，那么等待将不可避免。对于这种情况，我们就需要降低并行处理的并行度。
当出现PX Deq Credit：send blkd等待的时间很长时，我们可以通过平均等待时间来判断等待事件是不是下层的并行服务进程空闲造成的。该等待事件的超时时间是2秒，如果平均等待时间也差不多是2秒，就说明是下层的并行进程“无事所做”，处于空闲状态。如果和2秒的差距很大，就说明不是下层并行服务超时导致的空闲等待，而是并行服务之间的竞争导致的，因为这个平均等待事件非常短，说明并行服务进程在很短时间的等待之后就可以获取资源来处理数据。
所以对于非下层的并行进程造成的等待，解决的方法就是降低每个并行执行的并行度，比如对象（表，索引）上预设的并行度或者查询Hint 指定的并行度。
并行执行的使用范围
Parallel Query( 并行查询 )
并行查询可以在查询语句，子查询语句中使用，但是不可以使用在一个远程引用的对象上（如DBLINK）。
一个查询能够并行执行，需要满足以下条件
1、SQL语句中有Hint提示，比如Parallel或者Parallel_index。
2、SQL语句中引用的对象被设置了并行属性。
3、多表关联中，至少有一个表执行全表扫描（Full table scan）或者跨分区的Index range SCAN。如：
select /*+parallel(t 4)×/ * from t;
Parallel DDL（并行DDL操作，如建表，建索引等）
表的并行操作
CREATE TABLE table_name parallel 4 AS SELECT ....
ALTER TABLE table_name move partition partition_name parallel 4;
Alter table table_name split partition partition_name ...... parallel 4;
Alter table table_name coalesce partition parallel 4;
DDL操作，我们可以通过trace 文件来查看它的执行过程。
alter session set events '10046 trace name context forever,level 12';
alter session set events '10046 trace name context off' ;
创建索引的并行执行
创建索引时使用并行方式在系统资源充足的时候会使性能得到很大的提高，特别是在OLAP系统上对一些很大的表创建索引时更是如此。以下的创建和更改索引的操作都可以使用并行：
Create index index_name on table_name(colum_name) parallel 4;
Alter index index_name rebuild parallel 4
Alter index index_name rebuild partition partition_name parallel 4;
Alter index index_name split partition partition_name .... parallel 4;
注意：索引上的并行度只有在访问索引的时候才可以被使用。
总结：
使用并行方式，不论是创建表，修改表，创建索引，重建索引，他们的机制都是一样的，那就是Oracle 给每个并行服务进程分配一块空间，每个进程在自己的空间里处理数据，最后将处理完毕的数据汇总，完成SQL的操作。
Parallel DML（并行DML操作，如insert，update，delete等）
Oracle 可以对DML操作使用并行执行，但是有很多限制。如果我们要让DML操作使用并行执行，必须显示地在会话里执行如下命令：
SQL> alter session enable parallel dml;
会话已更改。
只有执行了这个操作，Oracle 才会对之后符合并行条件的DML操作并行执行，如果没有这个设定，即使SQL中指定了并行执行，Oracle也会忽略它。
delete，update和merge样例如下
delete /*+ parallel(table_name 4) */ from test;
update/*+ parallel(table_name 4) */ test set id=100;
merge /*+ parallel(table_name 4) */ into table_name ...
Oracle 对Delete,update,merge的操作限制在，只有操作的对象是分区表示，Oracle才会启动并行操作。原因在于，对于分区表，Oracle 会对每个分区启用一个并行服务进程同时进行数据处理，这对于非分区表来说是没有意义的。分区表的并行属性只能在表级别设置，不能在分区级别设置。
注:经笔者测试中非分区表下， Delete,update,merge也可以执行并行操作，不知道是版本原因还是其他原因，待考证
Insert 的并行操作
实际上只有对于insert into … select … 这样的SQL语句启用并行才有意义。对于insert into .. values… 并行没有意义，因为这条语句本身就是一个单条记录的操作。
Insert 并行常用的语法是：
Insert /*+parallel(t 2) */ into t select /*+parallel(t1 2) */ * from t1;
这条SQL 语句中，可以让两个操作insert 和select 分别使用并行，这两个并行是相互独立，互补干涉的，也可以单独使用其中的一个并行。也有如下语法
Insert into t select /*+parallel(t1 2) */ * from t1;
Insert /*+parallel(t 2) */ into t select * from t1;
并行执行的设定
并行相关的初始话参数
parallel_min_servers=n
在初始化参数中设置了这个值，Oracle 在启动的时候就会预先启动N个并行服务进程，当SQL执行并行操作时，并行协调进程首先根据并行度的值，在当前已经启动的并行服务中条用n个并行服务进程，当并行度大于n时，Oracle将启动额外的并行服务进程以满足并行度要求的并行服务进程数量。
parallel_max_servers=n
如果并行度的值大于parallel_min_servers或者当前可用的并行服务进程不能满足SQL的并行执行要求，Oracle将额外创建新的并行服务进程，当前实例总共启动的并行服务进程不能超过这个参数的设定值。一般该值设为CPU_COUNT-1即可。
parallel_adaptive_multi_user=true|false
Oracle 10g R2下，并行执行默认是启用的。这个参数的默认值为true，它让Oracle根据SQL执行时系统的负载情况，动态地调整SQL的并行度，以取得最好的SQL执行性能。
parallel_min_percent
这个参数指定并行执行时，申请并行服务进程的最小值，它是一个百分比，比如我们设定这个值为50. 当一个SQL需要申请20个并行进程时，如果当前并行服务进程不足，按照这个参数的要求，这个SQL比如申请到20*50%=10个并行服务进程，如果不能够申请到这个数量的并行服务，SQL将报出一个ORA-12827的错误。当这个值设为Null时，表示所有的SQL在做并行执行时，至少要获得两个并行服务进程。
PARALLEL_DEGREE_ POLICY
该参数为11g的新增参数，有如下3个属性值：
manual，默认值，表示不自动调节并行度。
auto，自动调节并行度。
limited，对于在相关表或者索引上已经定义了并行度的查询进行自动并行度调节，没有在相关表或者索引上已经定义并行度的查询不进行自动并行度调节。
PARALLEL_THREADS_PER_ CPU
一个CPU 在并行执行过程中可处理的进程或线程的数量，并优化并行自适应算法和负载均衡算法。如果计算机在执行一个典型查询时有超负荷的迹象，应减小该数值为任何非零值。根据操作系统而定 (通常为 2)
parallel_automatic_tuning
如果设置为 TRUE，Oracle 将为控制并行执行的参数确定默认值。除了设置该参数外，你还必须为系统中的表设置并行性
parallel_execution_message_size
指定并行执行 (并行查询、PDML、并行恢复和复制) 消息的大小。如果值大于 2048 或 4096，就需要更大的共享池。如果 PARALLEL_AUTOMATIC_TUNING =TRUE，将在大存储池之外指定消息缓冲区。如果PARALLEL_AUTOMATIC_TUNING 为 FALSE，通常值为 2148；如果PARALLEL_AUTOMATIC_TUNING 为 TRUE ，则值为 4096 (根据操作系统而定)。
并行度可以通过以下三种方式来设定：
1、使用Hint 指定并行度。
2、使用alter session force parallel 设定并行度。
3、使用SQL中引用的表或者索引上设定的并行度，原则上Oracle 使用这些对象中并行度最高的那个值作为当前执行的并行度。
示例：
SQL>Select /*+parallel(t 4) */ count(*) from t;
SQL>Alter table t parallel 4;
SQL>Alter session force parallel query parallel 4;
SQL>alter session force parallel query；
Oracle 默认并行度计算方式：
1、Oracle 根据CPU的个数，RAC实例的个数以及参数parallel_threads_per_cpu的值，计算出一个并行度。
2、对于并行访问分区操作，取需要访问的分区数为并行度。
并行度的优先级别从高到低：
Hint->alter session force parallel->表，索引上的设定-> 系统参数
实际上，并行只有才系统资源比较充足的情况下，才会取得很好的性能，如果系统负担很重，不恰当的设置并行，反而会使性能大幅下降。
11g中的并行
在Oracle 11g R2以及之前的版本，你的SQL执行可能被延迟，直到有充足的并行服务器可用。

Oracle有一种轮换IO机制，叫做“直接路径IO”，如果它判断到绕过缓存区直接执行IO会更快速的话，它就会启用。例如，Oracle在读写临时段进行排序或者整理中间结果集时就会使用直接IO。从Oracle 11g开始，Oracle有时也优先利用直接路径IO来处理串行表访问，而不是正常的缓存IO。

在执行并行查询操作时，Oracle通常会使用直接路径IO。通过使用直接路径IO，Oracle可以避免创建高速缓存竞争，并可以使IO更加优化地在并行进程之间分配。此外，对于执行全表扫描的并行操作，在高速缓存找到匹配数据的机会相当低，因此高速缓存几乎没有增加什么价值。

在Oracle 10g以及更早的版本，并行查询总是使用直接路径IO，而串行查询将总是使用缓存IO。在11g中，Oracle可以对并行查询利用缓存IO(从11g R2以后的版本支持)，而且串行查询也可能利用直接路径IO。然而，并行查询仍然不太可能利用缓存IO，因此，可能比串行查询需要更高的IO成本。当然，更高的IO成本将在所有并行进程之间共享，这样整体性能仍可能更胜一筹。

并行的优化准则
从优化串行执行的SQL开始
一个最理想的并行计划与最佳的串行计划可能是有区别的。例如，并行处理通常从表或索引的扫描开始，而最佳串行计划可能是基于索引查找开始。然而，你应该确保你的查询在进行并行优化之前先对串行执行进行优化，原因如下：
1、串行调试的结构和方法主要针对索引和统计集合，而这些经常对好的并行调试也非常关键。
2、如果请求并行执行的资源不可用，你的查询可能被串行化(这取决于“PARALLEL_DEGREE_ POLICY”和“PARALLEL_MIN_PERCENT”的设置)。在这种情况下，你要确保你并行查询的串行计划足够好。
缺少调优的SQL甚至可能变成更差的SQL，至少考虑到对其他用户的影响时是这样，这使它被允许消耗数据库服务器更多的CPU和IO资源。
在为并行执行优化SQL语句时，要从未串行执行SQL优化开始。
确保该SQL是合适的并行执行SQL
不是每个SQL都能从并行执行中获益的。下面是一些例子，这些情况的SQL语句可能不应该被并行化。
1、串行执行时，执行时间很短的SQL语句。
2、可能在多个会话中高并发率运行的SQL语句。
3、基于索引查找的SQL语句。非并行的索引查找或者范围扫描不能被并行化。然而，索引全扫描可以被并行化。在分区索引上的索引查找也可以被并行化。
综上3点，OLTP类型的查询通常不适合并行化处理。
确保系统适合配置为并行执行
不是所有的SQL都适合并行执行，也不是所有的数据库服务器主机适合配置并行处理。在当今世界，大部分物理服务器主机都满足如下最小需求：多块CPU和跨多个物理驱动器的数据带。然而，一些虚拟主机可能不满足这些最小需求，而桌面计算机通常只有唯一的磁盘设备，因此通常不适合调整为并行执行。
不要尝试在那些不满足最小需求(多块CPU和跨多个磁盘驱动器的数据带)的计算机系统上使用并行执行。
确保执行计划的所有部分都被并行化了
在复杂的并行SQL语句中，很重要的一点是要确保该查询执行的所有重要步骤都实现了并行。如果某复杂查询的其中一个步骤是串行执行的，其他并行步骤可能也不得不等待该串行步骤完成，这样并行机制的优势就完全丧失了。“PLAN_TABLE”表中的“OTHER_TAG”列用 “PARALLEL_FROM_SERIAL”标记指定了这样一个步骤，“DBMS_XPLAN”在“IN-OUT”列中记录了“S->P”。例如：在下面的例子中表“T1”是并行化的，但是表“T”不是。对两个表的连接和“GROUP BY”包括许多并行操作，但是对“T”表的全表扫描不是并行化的，串到并(S->P)标记展示了“t”行被串行提取到后续并行操作中：
SQL> ALTER TABLE customers PARALLEL(DEGREE 4);
SQL> ALTER TABLE sales NOPARALLEL ;
SQL> explain plan for select /*+ ordered use_hash(t1) */ t.name,sum(t.id) from t,t1 where t.id=t1.object_id group by t.name;
SQL> 1* select * from table(dbms_xplan.display)
PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Plan hash value: 2575143521
----------------------------------------------------------------------------------------------------------------------
| Id | Operation                    | Name     | Rows | Bytes | Cost (%CPU)| Time     |    TQ |IN-OUT| PQ Distrib |
----------------------------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT             |          |    61 | 4758 |    22 (10)| 00:00:01 |        |      |            |
|   1 | PX COORDINATOR              |          |       |       |            |          |        |      |            |
|   2 |   PX SEND QC (RANDOM)        | :TQ10002 |    61 | 4758 |    22 (10)| 00:00:01 | Q1,02 | P->S | QC (RAND) |
|   3 |    HASH GROUP BY             |          |    61 | 4758 |    22 (10)| 00:00:01 | Q1,02 | PCWP |            |
|   4 |     PX RECEIVE               |          |    61 | 4758 |    22 (10)| 00:00:01 | Q1,02 | PCWP |            |
|   5 |      PX SEND HASH            | :TQ10001 |    61 | 4758 |    22 (10)| 00:00:01 | Q1,01 | P->P | HASH       |

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
|   6 |       HASH GROUP BY          |          |    61 | 4758 |    22 (10)| 00:00:01 | Q1,01 | PCWP |            |
|* 7 |        HASH JOIN             |          |    61 | 4758 |    21   (5)| 00:00:01 | Q1,01 | PCWP |            |
|   8 |         BUFFER SORT          |          |       |       |            |          | Q1,01 | PCWC |            |
|   9 |          PX RECEIVE          |          |    61 | 3965 |    12   (0)| 00:00:01 | Q1,01 | PCWP |            |
| 10 |           PX SEND BROADCAST | :TQ10000 |    61 | 3965 |    12   (0)| 00:00:01 |        | S->P | BROADCAST |
| 11 |            TABLE ACCESS FULL | T        |    61 | 3965 |    12   (0)| 00:00:01 |        |      |            |
| 12 |         PX BLOCK ITERATOR    |          | 52078 |   661K|     8   (0)| 00:00:01 | Q1,01 | PCWC |            |
| 13 |          INDEX FAST FULL SCAN| T1_IDX   | 52078 |   661K|     8   (0)| 00:00:01 | Q1,01 | PCWP |            |
----------------------------------------------------------------------------------------------------------------------
像前面这种情况，部分并行化执行计划可能会导致两方面效果都很差：消耗的时间并没有改善，因为串行操作形成了整个执行的瓶颈。然而，该SQL还捆绑了并行服务器进程，而且可能影响其他并发执行SQL的性能。
如果我们为表“t”设置一个默认的并行度，该串行瓶颈将会消失。对“t”表的全扫描现在是按并行执行了，而且“串到并S->P”瓶颈将被全并行的“并到并P->P”操作替代
在优化并行执行计划时，要确保所有相关步骤都在并行执行：“DBMS_XPLAN”中的串到并S->P 标记或者“PLAN_TABLE”中的“PARALLEL_FROM_SERIAL”通常指示在并行计划的某些方面存在串行瓶颈。
确保请求的DOP(Degree Of Parallel)是可实现的
超过调优限度增加DOP可能给系统增加额外负载，而不会提升性能。在最坏的情况下，超过调优限度增加DOP可以导致查询运行时间减少。因此，设置合适的DOP对于数据库整体的健康和并行查询的性能优化都是非常重要的。
确保你请求或预期的DOP是现实的;过高的DOP可以导致数据库服务器负载过度，而不会提升SQL的性能。
监视实际DOP
你请求的DOP可能被优化，但是并不总是能成功。当多个并行查询竞争有限的并行执行资源时，DOP可能会减少，或者SQL语句可能会以串行模式运行。
我们前面讨论了Oracle如何决定实际DOP;最重要的参数“PARALLEL_MIN_PERCENT”，“PARALLEL_DEGREE_ POLICY”和“PARALLEL_ADAPTIVE_MULTI_USER”控制了Oracle改变DOP的方式，不管语句运行在降低并行，出错终止，还是在现存资源不足以请求的DOP运行该语句时推迟到后续处理。
DOP的减少可以导致你的并行SQL表现出令人失望的性能。你应该监视查询执行来看是否DOP的减少确实出现了。我们可以使用“V$PQ_TQSTAT”来度量实际DOP。见下例，
SQL> select dfo_number,tq_id,server_type,min(num_rows),max(num_rows),count(*) dop
from v$pq_tqstat
group by dfo_number,tq_id,server_type
order by dfo_number,tq_id,server_type
2    3    4    5 ;
DFO_NUMBER      TQ_ID SERVER_TYPE                    MIN(NUM_ROWS) MAX(NUM_ROWS)        DOP
---------- ---------- ------------------------------ ------------- ------------- ----------
         1          0 Consumer                                  61            61          1
         1          0 Producer                                   0            49          4
值得一提的是，由于操作间并行会有多组slave process通信，例如组1scan数据给组2 order by, 该视图中的server_type字段中就把组1定义为生产者(producer)，组2定义为消费者(consumer)
我们还可以利用v$session中的PDML_STATUS,PDDL_STATUS,PQ_STATUS查看当前会话的默认并行状态
select PDML_STATUS,PDDL_STATUS,PQ_STATUS from v$session

另外，还可以利用如下方式查询系统的并行状态

当并行启动时，Oracle中的并行伺候进程池会根据系统中的负荷和实际因素，确定分配出的并行进程数量。此时，我们可以通过视图v$px_process来查看进程池中的连接信息。
select * from v$px_process;

注意:并行伺候进程是一种特殊的Server Process，本质上是一种可共享的slave进程。专用连接模式下，一般的Server Process与Client Process是“同生共死”的关系，终身服务于一个Client Process。而伺候slave进程是通过进程池进行管理的，一旦启动初始化，就会在一定时间内驻留在系统中，等待下次并行处理到来。
此时，我们检查v$process视图，也可以找到对应的信息。
SQL> select * from v$process;
PID SPID         PNAME USERNAME          SERIAL# PROGRAM
-------- ---------- ------------------------ ----- --------------- ---------- -------------------------------
25 5776          P000 oracle                 13 oracle@oracle11g(P000)
26 5778          P001 oracle                  6 oracle@oracle11g(P001)
（篇幅原因，有省略……）
32 rows selected
对应的OS中，也存在相应的真实进程伺候。
$ ps -ef | grep oracle
（篇幅原因，有省略……）
oracle   5700    1 0 17:29 ?       00:00:02 oraclewilson (LOCAL=NO)
oracle   5723    1 0 17:33 ?       00:00:00 ora_smco_wilson
oracle   5764    1 2 17:40 ?       00:00:05 oraclewilson (LOCAL=NO)
oracle   5774    1 0 17:42 ?       00:00:00 oraclewilson (LOCAL=NO)
oracle   5776    1 0 17:43 ?       00:00:00 ora_p000_wilson
oracle   5778    1 0 17:43 ?       00:00:00 ora_p001_wilson
oracle   5820    1 1 17:44 ?       00:00:00 ora_w000_wilson

并行操作进程的资源消耗，通过v$px_sysstat视图查看。
SQL> col statistic for a30;
SQL> select * from v$px_process_sysstat;
STATISTIC                          VALUE
------------------------------ ----------
Servers In Use                         0
Servers Available                      0
Servers Started                        2
Servers Shutdown                       2
Servers Highwater                      2
Servers Cleaned Up                     0
Server Sessions                        6
Memory Chunks Allocated                4
Memory Chunks Freed                    0
Memory Chunks Current                  4
Memory Chunks HWM                      4
Buffers Allocated                     30
Buffers Freed                         30
Buffers Current                        0
Buffers HWM                            8
15 rows selected
如果你发现降级的并行导致了令人失望的性能，你可能想重新审查你的系统资源(内存，IO带宽)，调度并行SQL，或者重新检查服务器配置。可能的选择包括：
重新调度SQL，以便它们不要并发运行。Oracle 11g R2可以自动调度SQL，只要你设置“PARALLEL_ DEGREE_POLICY”参数为“AUTO”。
调整并行配置参数，以支持更大的并发并行。你可以通过增加“PARALLEL_THREADS_PER_ CPU”或者“PARALLEL_MAX_SERVERS”的值来做到这一点。这里的风险是并行执行的总量将会比你系统能支持的数量要多，这会导致SQL 性能退化。
增加你数据库服务器的性能。你可以增加CPU数量，RAC集群中实例的数量，你磁盘阵列中磁盘的数量。
调整“PARALLEL_MIN_PERCENT ”参数，使SQL可以运行在较少的并行状态下，而不是报错。