Oracle笔记第二篇----索引及查询性能优化

来源：互联网发布：adobe pdf mac 编辑：程序博客网时间：2024/05/17 07:51

索引:是由Oracle维护的可选结构，为数据提供快速的访问。准确地判断在什么地方需要使用索引是困难的，使用索引有利于调节检索速度。当建立一个索引时，必须指定用于跟踪的表名以及一个或多个表列。一旦建立了索引，在用户表中建立、更改和删除数据库时， Oracle就自动地维护索引。创建索引时，下列准则将帮助用户做出决定：

1) 索引应该在SQL语句的"where"或"and"部分涉及的表列(也称谓词)被建立。假如personnel表的"firstname"表列作为查询结果显示，而不是作为谓词部分，则不论其值是什么，该表列不会被索引。

2) 用户应该索引具有一定范围的表列，索引时有一个大致的原则：如果表中列的值占该表中行的2 0 %以内，这个表列就可以作为候选索引表列。假设一个表有36 000行且表中一个表列的值平均分布(大约每12000行)，那么该表列不适合于一个索引。然而，如果同一个表中的其他表列中列值的行在1 0 0 0～1 5 0 0之间(占3 %～4 % )，则该表列可用作索引。

使用索引的优势与代价。
优势：
1）索引是表的一个概念部分,用来提高检索数据的效率，ORACLE使用了一个复杂的自平衡B-tree结构. 通常,通过索引查询数据比全表扫描要快. 当ORACLE找出执行查询和Update语句的最佳路径时, ORACLE优化器将使用索引. 同样在联结多个表时使用索引也可以提高效率.
2）另一个使用索引的好处是,它提供了主键(primary key)的唯一性验证.。那些LONG或LONG RAW数据类型, 你可以索引几乎所有的列. 通常, 在大型表中使用索引特别有效. 当然,你也会发现, 在扫描小表时,使用索引同样能提高效率.

代价： 虽然使用索引能得到查询效率的提高,但是我们也必须注意到它的代价. 索引需要空间来存储,也需要定期维护, 每当有记录在表中增减或索引列被修改时, 索引本身也会被修改. 这意味着每条记录的INSERT , DELETE , UPDATE将为此多付出4 , 5 次的磁盘I/O . 因为索引需要额外的存储空间和处理,那些不必要的索引反而会使查询反应时间变慢.。而且表越大，影响越严重。

Oracle查询性能优化

使用索引需要注意的地方：

原则一:避免改变索引列的类型

　　当比较不同数据类型的数据时, oracle自动对列进行简单的类型转换.

假设 empno是一个数值类型的索引列:
　　select …from emp where empno = '123'
　　实际上,经过ORACLE类型转换, 语句转化为: select … from emp where empno = to_number('123')

　　幸运的是,类型转换没有发生在索引列上,索引的用途没有被改变.

　　现在,假设emp_type是一个字符类型的索引列: select … from emp where emp_type = 123
　　这个语句被oracle转换为: select … from emp where to_number(emp_type)=123

　　因为内部发生的类型转换, 这个索引将不会被用到! 为了避免oracle对你的sql进行隐式的类型转换, 最好把类型转换用显式表现出来. 注意当字符和数值比较时, oracle会优先转换数值类型到字符类型.

原则二： SELECT子句中避免使用 ‘ * ‘：
ORACLE在解析的过程中, 会将'*' 依次转换成所有的列名, 这个工作是通过查询数据字典完成的, 这意味着将耗费更多的时间。

简单地讲，语句执行的时间越短越好（尤其对于系统的终端用户来说）。而对于查询语句，由于全表扫描读取的数据多，尤其是对于大型表不仅查询速度慢，而且对磁盘IO造成大的压力，通常都要避免，而避免的方式通常是使用索引Index。

原则三:避免在索引列上使用IS NULL和IS NOT NULL

　　不能用null作索引，任何包含null值的列都将不会被包含在索引中。即使索引有多列这样的情况下，只要这些列中有一列含有null，该列就会从索引中排除。也就是说如果某列存在空值，即使对该列建索引也不会提高性能。

　　任何在where子句中使用is null或is not null的语句优化器是不允许使用索引的。

低效:(索引失效) SELECT … FROM DEPARTMENT WHERE DEPT_CODE IS NOT NULL;

高效:(索引有效)SELECT … FROM DEPARTMENT WHERE DEPT_CODE >=0;

原则四:避免在索引列上使用NOT ，　

我们要避免在索引列上使用NOT, NOT会产生在和在索引列上使用函数相同的影响. 当ORACLE”遇到”NOT,他就会停止使用索引转而执行全表扫描.

原则五:避免在索引列上使用计算．

WHERE子句中，如果索引列是函数的一部分．优化器将不使用索引而使用全表扫描．举例:

低效:SELECT … FROM DEPT WHERE SAL * 12 > 25000;

高效:SELECT … FROM DEPT WHERE SAL > 25000/12;

原则六:注意通配符%的影响

使用通配符的情况下Oracle可能会停用该索引。如 :

SELECT…FROM DEPARTMENT WHERE DEPT_CODE like ‘%123456%'（无效）。

SELECT…FROM DEPARTMENT WHERE DEPT_CODE = ‘123456'（有效）

原则七:索引的一些“脾气”

a. 如果检索数据量超过30%的表中记录数.使用索引将没有显著的效率提高.

b. 在特定情况下, 使用索引也许会比全表扫描慢, 但这是同一个数量级上的区别. 而通常情况下,使用索引比全表扫描要块几倍乃至几千倍!

原则八:'!=' 将不使用索引. 记住, 索引只能告诉你什么存在于表中, 而不能告诉你什么不存在于表中

不使用索引: select * from employee where salary<>3000;
使用索引: select account_name from transaction where amount >0;

使用索引: select * from employee where salary<3000 or salary>3000;

原则九:联接列,'||'是字符连接函数. 就象其他函数那样, 停用了索引

不使用索引: select account_name,amount from transaction where account_name||account_type='AMEXA';

使用索引: select account_name,amount from transaction where account_name = 'AMEX' and account_type=' A';

原则十:'+'是数学函数. 就象其他数学函数那样, 停用了索引

不使用索引: select account_name, amount from transaction where amount + 3000 >5000;

使用索引: select account_name, amount from transaction where amount > 2000 ;

原则十一:相同的索引列不能互相比较,这将会启用全表扫描

不使用索引: select account_name, amount from transaction where account_name = nvl(:acc_name,account_name);

使用索引: select account_name, amount from transaction where account_name like nvl(:acc_name,'%');

原则十二:用EXISTS替换DISTINCT和in

不使用索引: ... where column in(select * from ... where ...);
使用索引: ... where exists (select 'X' from ...where ...);

同时应尽可能使用NOT EXISTS来代替NOT IN，尽管二者都使用了NOT（不能使用索引而降低速度），NOT EXISTS要比NOT IN查询效率更高。

(低效): SELECT DISTINCT DEPT_NO,DEPT_NAME FROM DEPT D , EMP E
WHERE D.DEPT_NO = E.DEPT_NO
And E.sex =man
(高效): SELECT DEPT_NO,DEPT_NAME FROM DEPT D
WHERE EXISTS
( SELECT ‘X' FROM EMP E WHERE E.DEPT_NO = D.DEPT_NO
And E.sex =man

);

原则十三;用(UNION)UNION ALL替换OR (适用于索引列)

通常情况下, 用UNION替换WHERE子句中的OR将会起到较好的效果. 对索引列使用OR将造成全表扫描.
注意, 以上规则只针对多个索引列有效. 如果有column没有被索引, 查询效率可能会因为你没有选择OR而降低. 在下面的例子中, LOC_ID 和REGION上都建有索引.
如果你坚持要用OR, 那就需要返回记录最少的索引列写在最前面.

高效: SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE LOC_ID = 10 UNION ALLSELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE REGION = “MELBOURNE”

低效: SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE LOC_ID = 10 OR REGION = “MELBOURNE”

原则十四;Order By语句加在索引列，最好是主键PK上。注意:ORDER BY中所有的列必须定义为非空.

SELECT DEPT_CODE FROM DEPT ORDER BY DEPT_TYPE（低效）

SELECT DEPT_CODE FROM DEPT ORDER BY DEPT_CODE （高效）

原则十五:避免使用耗费资源的操作:

带有DISTINCT,UNION,MINUS,INTERSECT的SQL语句会启动SQL引擎执行耗费资源的排序(SORT)功能. DISTINCT需要一次排序操作, 而其他的至少需要执行两次排序. 通常, 带有UNION, MINUS , INTERSECT的SQL语句都可以用其他方式重写. 如果你的数据库的SORT_AREA_SIZE调配得好, 使用UNION , MINUS, INTERSECT也是可以考虑的, 毕竟它们的可读性很强

最后扩展:

怎样监控无用的索引

　　Oracle 9i以上，可以监控索引的使用情况，如果一段时间内没有使用的索引，一般就是无用的索引

　　语法为：
　　开始监控：alter index index_name monitoring usage;
　　检查使用状态：select * from v$object_usage;

　　停止监控：alter index index_name nomonitoring usage;

如果写了索引但是没有走索引怎么办?

答:写语句的时候指定走强制索引

SELECT /*+INDEX(表名索引名)*/ ....from ....

强制不走索引

/*+NO_Index(表名/表别名索引名 )*/

PS:有的文章说要注意where 条件的顺序限制多的放后面表连接的放前面经过宝宝亲测,根本就没有用哦~!

0 0