Oracle对数据的访问方式

来源:互联网 发布:plc的编程语言有哪些 编辑:程序博客网 时间:2024/06/03 14:52
      Oracle对数据的访问方式有:全表扫描、ROWID扫描、索引扫描,而索引扫描又可以再细分,请看下面详解。
    1) 全表扫描(Full Table Scans, FTS)
    为实现全表扫描,Oracle读取表中所有的行,并检查每一行是否满足语句的WHERE限制条件。一个多块读操
作可以使一次I/O能读取多块数据块(db_block_multiblock_read_count参数设定),而不是只读取一个数据块,
这极大的减少了I/O总次数,提高了系统的吞吐量,所以利用多块读的方法可以十分高效地实现全表扫描,而
且只有在全表扫描的情况下才能使用多块读操作。在这种访问模式下,每个数据块只被读一次。
    使用FTS的前提条件:在较大的表上不建议使用全表扫描,除非取出数据的比较多,超过总量的5% -- 10%,
或你想使用并行查询功能时。   
    使用全表扫描的例子:

SQL> create table t3 as select * from dba_objects;
SQL> explain plan for select count(*) from t3;

Explained.

SQL> select * from table(dbms_xplan.display());

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
Plan hash value: 463314188

-------------------------------------------------------------------
| Id  | Operation          | Name | Rows  | Cost (%CPU)| Time     |
-------------------------------------------------------------------
|   0 | SELECT STATEMENT   |      |     1 |    37   (0)| 00:00:01 |
|   1 |  SORT AGGREGATE    |      |     1 |            |          |
|   2 |   TABLE ACCESS FULL| T3   | 10701 |    37   (0)| 00:00:01 |
-------------------------------------------------------------------

9 rows selected.

    2) 通过ROWID的表存取(Table Access by ROWID或rowid lookup)
    行的ROWID指出了该行所在的数据文件、数据块以及行在该块中的位置,所以通过ROWID来存取数据可以快速
定位到目标数据上,是Oracle存取单行数据的最快方法。这种存取方法不会用到多块读操作,一次I/O只能读
取一个数据块。我们会经常在执行计划中看到该存取方法,如通过索引查询数据。
    使用ROWID存取的例子:
SQL> explain plan for select * from t3 where rowid='AAACa8AAGAAAAAMAAA';

Explained.

SQL> select * from table(dbms_xplan.display);

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
Plan hash value: 487051824

-----------------------------------------------------------------------------------
| Id  | Operation                  | Name | Rows  | Bytes | Cost (%CPU)| Time     |
-----------------------------------------------------------------------------------
|   0 | SELECT STATEMENT           |      |     1 |    83 |     1   (0)| 00:00:01 |
|   1 |  TABLE ACCESS BY USER ROWID| T3   |     1 |    83 |     1   (0)| 00:00:01 |
-----------------------------------------------------------------------------------

8 rows selected.
        
    3)索引扫描(Index Scan或index lookup)
    我们先通过index查找到数据对应的rowid值(对于非唯一索引可能返回多个rowid值),然后根据rowid直接从
表中得到具体的数据,这种查找方式称为索引扫描或索引查找(index lookup)。一个rowid唯一的表示一行数
据,该行对应的数据块是通过一次i/o得到的,在此情况下该次i/o只会读取一个数据库块。在索引中,除了存
储每个索引的值外,索引还存储具有此值的行对应的ROWID值。
    索引扫描可以由2步组成:
    (1) 扫描索引得到对应的rowid值。
    (2) 通过找到的rowid从表中读出具体的数据。
    每步都是单独的一次I/O,但是对于索引,由于经常使用,绝大多数都已经CACHE到内存中,所以第1步的I/O
经常是逻辑I/O,即数据可以从内存中得到。但是对于第2步来说,如果表比较大,则其数据不可能全在内存
中,所以其I/O很有可能是物理I/O,这是一个机械操作,相对逻辑I/O来说,是极其费时间的。所以如果多大
表进行索引扫描,取出的数据如果大于总量的5% -- 10%,使用索引扫描会效率下降很多。
    如下列所示:
SQL> explain plan for select object_id,object_name from t3 where object_id=100;

Explained.

SQL> select * from table(dbms_xplan.display());

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
Plan hash value: 2055997378

--------------------------------------------------------------------------------------------
| Id  | Operation                   | Name         | Rows  | Bytes | Cost (%CPU)| Time     |
--------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT            |              |     1 |    79 |     2   (0)| 00:00:01 |
|   1 |  TABLE ACCESS BY INDEX ROWID| T3           |     1 |    79 |     2   (0)| 00:00:01 |
|*  2 |   INDEX UNIQUE SCAN         | IDX_T3_OBJID |     1 |       |     1   (0)| 00:00:01 |
--------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
---------------------------------------------------

   2 - access("OBJECT_ID"=100)
   
14 rows selected.

    但是如果查询的数据能全在索引中找到,就可以避免进行第2步操作,避免了不必要的I/O,此时即使通过索
引扫描取出的数据比较多,效率还是很高的。
  
SQL> explain plan for select object_id from t3 where object_id=100;                -- 只查询object_id列值

Explained.

SQL> select * from table(dbms_xplan.display());

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
Plan hash value: 1883414866

----------------------------------------------------------------------------------
| Id  | Operation         | Name         | Rows  | Bytes | Cost (%CPU)| Time     |
----------------------------------------------------------------------------------
|   0 | SELECT STATEMENT  |              |     1 |    13 |     1   (0)| 00:00:01 |
|*  1 |  INDEX UNIQUE SCAN| IDX_T3_OBJID |     1 |    13 |     1   (0)| 00:00:01 |
----------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------

   1 - access("OBJECT_ID"=100)

13 rows selected.

    进一步讲,如果sql语句中对索引列进行排序,因为索引已经预先排序好了,所以在执行计划中不需要再对
索引列进行排序

SQL> explain plan for select object_id,object_name from t3 where object_id>100 order by 1;

Explained.

SQL> select * from table(dbms_xplan.display());

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
Plan hash value: 1179893576

--------------------------------------------------------------------------------------------
| Id  | Operation                   | Name         | Rows  | Bytes | Cost (%CPU)| Time     |
--------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT            |              |   535 | 42265 |     4   (0)| 00:00:01 |
|   1 |  TABLE ACCESS BY INDEX ROWID| T3           |   535 | 42265 |     4   (0)| 00:00:01 |
|*  2 |   INDEX RANGE SCAN          | IDX_T3_OBJID |    96 |       |     2   (0)| 00:00:01 |
--------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
---------------------------------------------------

   2 - access("OBJECT_ID">100)
       filter("OBJECT_ID">100)

15 rows selected.

    从这个例子中可以看到:因为索引是已经排序了的,所以将按照索引的顺序查询出符合条件的行,因此避免
了进一步排序操作。根据索引的类型与where限制条件的不同,有4种类型的索引扫描:
    索引唯一扫描(index unique scan)
    索引范围扫描(index range scan)
    索引全扫描(index full scan)
    索引快速扫描(index fast full scan)
    索引跳跃式扫描(index skip scan)
    
    (1) 索引唯一扫描(index unique scan)   
    通过唯一索引查找一个数值经常返回单个ROWID。
    如果存在UNIQUE 或PRIMARY KEY 约束(它保证了语句只存取单行)的话,Oracle经常实现唯一性扫描。
    使用唯一性约束的例子:
SQL> explain plan for select object_id,object_name from t3 where object_id=100;

Explained.

SQL>  select * from table(dbms_xplan.display());

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
Plan hash value: 2055997378

--------------------------------------------------------------------------------------------
| Id  | Operation                   | Name         | Rows  | Bytes | Cost (%CPU)| Time     |
--------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT            |              |     1 |    79 |     2   (0)| 00:00:01 |
|   1 |  TABLE ACCESS BY INDEX ROWID| T3           |     1 |    79 |     2   (0)| 00:00:01 |
|*  2 |   INDEX UNIQUE SCAN         | IDX_T3_OBJID |     1 |       |     1   (0)| 00:00:01 |
--------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
---------------------------------------------------

   2 - access("OBJECT_ID"=100)

14 rows selected.
    
    (2) 索引范围扫描(index range scan)
    使用一个索引存取多行数据,在唯一索引上使用索引范围扫描的典型情况下是在谓词(where限制条件)中使
    用了范围操作符(如>、<、<>、>=、<=、between)   
    使用索引范围扫描的例子:
SQL> explain plan for select object_id,object_name from t3 where object_id>2000 order by 1;

Explained.

SQL> select * from table(dbms_xplan.display());

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
Plan hash value: 1179893576

--------------------------------------------------------------------------------------------
| Id  | Operation                   | Name         | Rows  | Bytes | Cost (%CPU)| Time     |
--------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT            |              |   535 | 42265 |     4   (0)| 00:00:01 |
|   1 |  TABLE ACCESS BY INDEX ROWID| T3           |   535 | 42265 |     4   (0)| 00:00:01 |
|*  2 |   INDEX RANGE SCAN          | IDX_T3_OBJID |    96 |       |     2   (0)| 00:00:01 |
--------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
---------------------------------------------------

   2 - access("OBJECT_ID">2000)
       filter("OBJECT_ID">2000)

15 rows selected.

    在非唯一索引上,谓词col = 8可能返回多行数据,所以在非唯一索引上都使用索引范围扫描。   
    使用index rang scan的3种情况:   
    (a) 在唯一索引列上使用了range操作符(> < <> >= <= between)   
    (b) 在组合索引上,只使用部分列进行查询,导致查询出多行   
    (c) 对非唯一索引列上进行的任何查询。   
    
    (3) 索引全扫描(index full scan)
    与全表扫描对应,也有相应的全索引扫描。而且此时查询出的数据都必须从索引中可以直接得到。
    全索引扫描的例子:
SQL> create index idx_t3_mix on t3(object_id,object_name);

Index created.

SQL> alter table t3 modify (object_name null);

Table altered.

SQL> explain plan for select OBJECT_ID,OBJECT_NAME from t3 order by 1,2;

Explained.

SQL> select * from table(dbms_xplan.display);

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
Plan hash value: 1749037557

-----------------------------------------------------------------------------------
| Id  | Operation          | Name | Rows  | Bytes |TempSpc| Cost (%CPU)| Time     |
-----------------------------------------------------------------------------------
|   0 | SELECT STATEMENT   |      |  9480 |   203K|       |   103   (1)| 00:00:02 |
|   1 |  SORT ORDER BY     |      |  9480 |   203K|   616K|   103   (1)| 00:00:02 |
|   2 |   TABLE ACCESS FULL| T3   |  9480 |   203K|       |    37   (0)| 00:00:01 |
-----------------------------------------------------------------------------------

9 rows selected.

SQL> alter table t3 modify (object_name not null);

Table altered.

SQL> explain plan for select OBJECT_ID,OBJECT_NAME from t3 order by 1,2;

Explained.

SQL> select * from table(dbms_xplan.display);

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
Plan hash value: 2805228418

-------------------------------------------------------------------------------
| Id  | Operation        | Name       | Rows  | Bytes | Cost (%CPU)| Time     |
-------------------------------------------------------------------------------
|   0 | SELECT STATEMENT |            |  9480 |   203K|    45   (0)| 00:00:01 |
|   1 |  INDEX FULL SCAN | IDX_T3_MIX |  9480 |   203K|    45   (0)| 00:00:01 |
-------------------------------------------------------------------------------

8 rows selected.

    (4) 索引快速扫描(index fast full scan)
    扫描索引中的所有的数据块,与 index full scan很类似,但是一个显著的区别就是它不对查询出的数据进
行排序,即数据不是以排序顺序被返回。在这种存取方法中,可以使用多块读功能,也可以使用并行读入,以
便获得最大吞吐量与缩短执行时间。   
    索引快速扫描的例子:   
SQL> explain plan for select OBJECT_ID,OBJECT_NAME from t3;

Explained.

SQL> select * from table(dbms_xplan.display);

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
Plan hash value: 2665280987

-----------------------------------------------------------------------------------
| Id  | Operation            | Name       | Rows  | Bytes | Cost (%CPU)| Time     |
-----------------------------------------------------------------------------------
|   0 | SELECT STATEMENT     |            |  9480 |   203K|    14   (0)| 00:00:01 |
|   1 |  INDEX FAST FULL SCAN| IDX_T3_MIX |  9480 |   203K|    14   (0)| 00:00:01 |
-----------------------------------------------------------------------------------

8 rows selected.

    只选择多列索引的第2列:
SQL> explain plan for select object_name from t3;

Explained.

SQL> select * from table(dbms_xplan.display);

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
Plan hash value: 2665280987

-----------------------------------------------------------------------------------
| Id  | Operation            | Name       | Rows  | Bytes | Cost (%CPU)| Time     |
-----------------------------------------------------------------------------------
|   0 | SELECT STATEMENT     |            |  9480 |   166K|    14   (0)| 00:00:01 |
|   1 |  INDEX FAST FULL SCAN| IDX_T3_MIX |  9480 |   166K|    14   (0)| 00:00:01 |
-----------------------------------------------------------------------------------

8 rows selected.

    (5) 索引跳跃式扫描(index skip scan)
    谓语条件列不是索引的前导列,这种情况下经常发生跳跃式扫描。
    如下:
SQL> explain plan for select /*+ index_ss(t3,IDX_T3_MIX) */ owner from t3 where object_name='AAA';

Explained.

SQL> select * from table(dbms_xplan.display);

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
Plan hash value: 3723812818

------------------------------------------------------------------------------------------
| Id  | Operation                   | Name       | Rows  | Bytes | Cost (%CPU)| Time     |
------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT            |            |     1 |    23 |  9483   (1)| 00:01:54 |
|   1 |  TABLE ACCESS BY INDEX ROWID| T3         |     1 |    23 |  9483   (1)| 00:01:54 |
|*  2 |   INDEX SKIP SCAN           | IDX_T3_MIX |     1 |       |  9482   (1)| 00:01:54 |
------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------
---------------------------------------------------

   2 - access("OBJECT_NAME"='AAA')
       filter("OBJECT_NAME"='AAA')

15 rows selected.

    总结:
    当进行index full scan的时候,oracle定位到索引的root block,然后到branch block(如果有的话),
再定位到第一个leaf block, 然后根据leaf block的双向链表顺序读取。它所读取的块都是有顺序的,也是经
过排序的。而index fast full scan则不同,它是从段头开始,读取包含位图块,root block,所有的branch
block,leaf block,读取的顺序完全由物理存储位置决定,并采取多块读,数据是无序的,每次读取
db_file_multiblock_read_count个块。这就是为什么两者的结果区别如此之大的原因。