通过分析SQL语句的执行计划优化SQL之七-服务器专区

通过分析SQL语句的执行计划优化SQL之七

作者：chinaitlab 佚名编辑： IT168 2006-03-07 00:00

　　【IT168 服务器学院】如何干预执行计划 - - 使用hints提示

　　基于代价的优化器是很聪明的，在绝大多数情况下它会选择正确的优化器，减轻了DBA的负担。但有时它也聪明反被聪明误，选择了很差的执行计划，使某个语句的执行变得奇慢无比。此时就需要DBA进行人为的干预，告诉优化器使用我们指定的存取路径或连接类型生成执行计划，从而使语句高效的运行。例如，如果我们认为对于一个特定的语句，执行全表扫描要比执行索引扫描更有效，则我们就可以指示优化器使用全表扫描。在ORACLE中，是通过为语句添加hints(提示)来实现干预优化器优化的目的。

      hints是oracle提供的一种机制，用来告诉优化器按照我们的告诉它的方式生成执行计划。我们可以用hints来实现：
　　1) 使用的优化器的类型
　　2) 基于代价的优化器的优化目标，是all_rows还是first_rows。
　　3) 表的访问路径，是全表扫描，还是索引扫描，还是直接利用rowid。
　　4) 表之间的连接类型
　　5) 表之间的连接顺序
　　6) 语句的并行程度

   除了”RULE”提示外，一旦使用的别的提示，语句就会自动的改为使用CBO优化器，此时如果你的数据字典中没有统计数据，就会使用缺省的统计数据。所以建议大家如果使用CBO或HINTS提示，则最好对表和索引进行定期的分析。

　　如何使用hints:

　　Hints只应用在它们所在sql语句块(statement block，由select、update、delete关键字标识)上，对其它SQL语句或语句的其它部分没有影响。如：对于使用union操作的2个sql语句，如果只在一个sql语句上有hints，则该hints不会影响另一个sql语句。

　　我们可以使用注释(comment)来为一个语句添加hints，一个语句块只能有一个注释，而且注释只能放在SELECT, UPDATE, or DELETE关键字的后面

　　使用hints的语法：

{DELETE|INSERT|SELECT|UPDATE} /*+ hint [text] [hint[text]]... */
or
{DELETE|INSERT|SELECT|UPDATE} --+ hint [text] [hint[text]]...

　　注解：
　　1) DELETE、INSERT、SELECT和UPDATE是标识一个语句块开始的关键字，包含提示的注释只能出现在这些关键字的后面，否则提示无效。
　　2) “+”号表示该注释是一个hints，该加号必须立即跟在”/*”的后面，中间不能有空格。
　　3) hint是下面介绍的具体提示之一，如果包含多个提示，则每个提示之间需要用一个或多个空格隔开。
　　4) text 是其它说明hint的注释性文本

　　如果你没有正确的指定hints，Oracle将忽略该hints，并且不会给出任何错误。

　　使用全套的hints：

　　当使用hints时，在某些情况下，为了确保让优化器产生最优的执行计划，我们可能指定全套的hints。例如，如果有一个复杂的查询，包含多个表连接，如果你只为某个表指定了INDEX提示(指示存取路径在该表上使用索引)，优化器需要来决定其它应该使用的访问路径和相应的连接方法。因此，即使你给出了一个INDEX提示，优化器可能觉得没有必要使用该提示。这是由于我们让优化器选择了其它连接方法和存取路径，而基于这些连接方法和存取路径，优化器认为用户给出的INDEX提示无用。为了防止这种情况，我们要使用全套的hints，如：不但指定要使用的索引，而且也指定连接的方法与连接的顺序等。

      下面是一个使用全套hints的例子，ORDERED提示指出了连接的顺序，而且为不同的表指定了连接方法：
SELECT /*+ ORDERED INDEX (b, jl_br_balances_n1) USE_NL (j b)
USE_NL (glcc glf) USE_MERGE (gp gsb) */
b.application_id, b.set_of_books_id ,
b.personnel_id, p.vendor_id Personnel,
p.segment1 PersonnelNumber, p.vendor_name Name
FROM jl_br_journals j, jl_br_balances b,
gl_code_combinations glcc, fnd_flex_values_vl glf,
gl_periods gp, gl_sets_of_books gsb, po_vendors p
WHERE ...

　　指示优化器的方法与目标的hints：

ALL_ROWS    -- 基于代价的优化器，以吞吐量为目标
FIRST_ROWS(n) -- 基于代价的优化器，以响应时间为目标
CHOOSE       -- 根据是否有统计信息，选择不同的优化器
RULE          -- 使用基于规则的优化器

例子：
SELECT /*+ FIRST_ROWS(10) */ employee_id, last_name, salary, job_id
FROM employees
WHERE department_id = 20;

SELECT /*+ CHOOSE */ employee_id, last_name, salary, job_id
FROM employees
WHERE employee_id = 7566;

SELECT /*+ RULE */ employee_id, last_name, salary, job_id
FROM employees
WHERE employee_id = 7566;

　　指示存储路径的hints：

FULL          /*+ FULL ( table ) */
指定该表使用全表扫描
ROWID       /*+ ROWID ( table ) */
指定对该表使用rowid存取方法，该提示用的较少
INDEX       /*+ INDEX ( table [index]) */
使用该表上指定的索引对表进行索引扫描
INDEX_FFS    /*+ INDEX_FFS ( table [index]) */
使用快速全表扫描
NO_INDEX    /*+ NO_INDEX ( table [index]) */
不使用该表上指定的索引进行存取，仍然可以使用其它的索引进行索引扫描

SELECT /*+ FULL(e) */ employee_id, last_name
FROM employees e
WHERE last_name LIKE :b1;

SELECT /*+ROWID(employees)*/ *
FROM employees
WHERE rowid > ''AAAAtkAABAAAFNTAAA'' AND employee_id = 155;

SELECT /*+ INDEX(A sex_index) use sex_index because there are few
male patients */ A.name, A.height, A.weight
FROM patients A
WHERE A.sex = ’m’;

SELECT /*+NO_INDEX(employees emp_empid)*/ employee_id
FROM employees
WHERE employee_id > 200;

　　指示连接顺序的hints:
ORDERED  /*+ ORDERED */
按from 字句中表的顺序从左到右的连接
STAR    /*+ STAR */
指示优化器使用星型查询

SELECT /*+ORDERED */ o.order_id, c.customer_id, l.unit_price * l.quantity
FROM customers c, order_items l, orders o
WHERE c.cust_last_name = :b1
AND o.customer_id = c.customer_id
AND o.order_id = l.order_id;

/*+ ORDERED USE_NL(FACTS) INDEX(facts fact_concat) */

指示连接类型的hints：
USE_NL       /*+ USE_NL ( table [,table, ...] ) */
使用嵌套连接
USE_MERGE    /*+ USE_MERGE ( table [,table, ...]) */
使用排序- -合并连接
USE_HASH    /*+ USE_HASH ( table [,table, ...]) */
使用HASH连接
注意：如果表有alias(别名)，则上面的table指的是表的别名，而不是真实的表名

　　具体的测试实例：
create table A(col1 number(4,0),col2 number(4,0), col4 char(30));
create table B(col1 number(4,0),col3 number(4,0), name_b char(30));
create table C(col2 number(4,0),col3 number(4,0), name_c char(30));

select A.col4
from C , A , B
where  C.col3 = 5 and  A.col1 = B.col1  and  A.col2 = C.col2
and B.col3 = 10;
Execution Plan
----------------------------------------------------------
0    SELECT STATEMENT Optimizer=CHOOSE
1 0 MERGE JOIN
2 1    SORT (JOIN)
3 2    MERGE JOIN
4 3       SORT (JOIN)
5 4          TABLE ACCESS (FULL) OF ''B''
6 3       SORT (JOIN)
7 6          TABLE ACCESS (FULL) OF ''A''
8 1    SORT (JOIN)
9 8    TABLE ACCESS (FULL) OF ''C''

select /*+ ORDERED */ A.col4
from C , A , B
where  C.col3 = 5 and  A.col1 = B.col1  and  A.col2 = C.col2
and B.col3 = 10;
Execution Plan
----------------------------------------------------------
0    SELECT STATEMENT Optimizer=CHOOSE (Cost=5 Card=1 Bytes=110)
1 0 HASH JOIN (Cost=5 Card=1 Bytes=110)
2 1    HASH JOIN (Cost=3 Card=1 Bytes=84)
3 2    TABLE ACCESS (FULL) OF ''C'' (Cost=1 Card=1 Bytes=26)
4 2    TABLE ACCESS (FULL) OF ''A'' (Cost=1 Card=82 Bytes=4756)
5 1    TABLE ACCESS (FULL) OF ''B'' (Cost=1 Card=1 Bytes=26)

select /*+ ORDERED USE_NL (A C)*/ A.col4
from C , A , B
where  C.col3 = 5 and  A.col1 = B.col1  and  A.col2 = C.col2
and B.col3 = 10;
Execution Plan
----------------------------------------------------------
0    SELECT STATEMENT Optimizer=CHOOSE (Cost=4 Card=1 Bytes=110)
1 0 HASH JOIN (Cost=4 Card=1 Bytes=110)
2 1    NESTED LOOPS (Cost=2 Card=1 Bytes=84)
3 2    TABLE ACCESS (FULL) OF ''C'' (Cost=1 Card=1 Bytes=26)
4 2    TABLE ACCESS (FULL) OF ''A'' (Cost=1 Card=82 Bytes=4756)
5 1    TABLE ACCESS (FULL) OF ''B'' (Cost=1 Card=1 Bytes=26)

创建索引：
create index inx_col12A on a(col1,col2);
select A.col4
from C , A , B
where  C.col3 = 5 and  A.col1 = B.col1  and  A.col2 = C.col2
and B.col3 = 10;
Execution Plan
----------------------------------------------------------
0    SELECT STATEMENT Optimizer=CHOOSE
1 0 MERGE JOIN
2 1    SORT (JOIN)
3 2    NESTED LOOPS
4 3       TABLE ACCESS (FULL) OF ''B''
5 3       TABLE ACCESS (BY INDEX ROWID) OF ''A''
6 5          INDEX (RANGE SCAN) OF ''INX_COL12A'' (NON-UNIQUE)
7 1    SORT (JOIN)
8 7    TABLE ACCESS (FULL) OF ''C''

select /*+ ORDERED */ A.col4
from C , A , B
where  C.col3 = 5 and  A.col1 = B.col1  and  A.col2 = C.col2
and B.col3 = 10;
Execution Plan
----------------------------------------------------------
0    SELECT STATEMENT Optimizer=CHOOSE (Cost=5 Card=1 Bytes=110)
1 0 HASH JOIN (Cost=5 Card=1 Bytes=110)
2 1    HASH JOIN (Cost=3 Card=1 Bytes=84)
3 2    TABLE ACCESS (FULL) OF ''C'' (Cost=1 Card=1 Bytes=26)
4 2    TABLE ACCESS (FULL) OF ''A'' (Cost=1 Card=82 Bytes=4756)
5 1    TABLE ACCESS (FULL) OF ''B'' (Cost=1 Card=1 Bytes=26)

select /*+ ORDERED USE_NL (A C)*/ A.col4
from C , A , B
where  C.col3 = 5 and  A.col1 = B.col1  and  A.col2 = C.col2
and B.col3 = 10;
Execution Plan
----------------------------------------------------------
0    SELECT STATEMENT Optimizer=CHOOSE (Cost=4 Card=1 Bytes=110)
1 0 HASH JOIN (Cost=4 Card=1 Bytes=110)
2 1    NESTED LOOPS (Cost=2 Card=1 Bytes=84)
3 2    TABLE ACCESS (FULL) OF ''C'' (Cost=1 Card=1 Bytes=26)
4 2    TABLE ACCESS (FULL) OF ''A'' (Cost=1 Card=82 Bytes=4756)
5 1    TABLE ACCESS (FULL) OF ''B'' (Cost=1 Card=1 Bytes=26)

select /*+ USE_NL (A C)*/ A.col4
from C , A , B
where  C.col3 = 5 and  A.col1 = B.col1  and  A.col2 = C.col2
and B.col3 = 10;

　　我们这个查询的意思是让A、C表做NL连接，并且让A表作为内表，但是从执行计划来看，没有达到我们的目的。
Execution Plan
----------------------------------------------------------
0    SELECT STATEMENT Optimizer=CHOOSE (Cost=3 Card=1 Bytes=110)
1 0 NESTED LOOPS (Cost=3 Card=1 Bytes=110)
2 1    MERGE JOIN (CARTESIAN) (Cost=2 Card=1 Bytes=52)
3 2    TABLE ACCESS (FULL) OF ''C'' (Cost=1 Card=1 Bytes=26)
4 2    SORT (JOIN) (Cost=1 Card=1 Bytes=26)
5 4       TABLE ACCESS (FULL) OF ''B'' (Cost=1 Card=1 Bytes=26)
6 1    TABLE ACCESS (FULL) OF ''A'' (Cost=1 Card=82 Bytes=4756)

对对象进行分析后：
analyze table a compute statistics;
analyze table b compute statistics;
analyze table c compute statistics;
analyze index inx_col12A compute statistics;
select A.col4
from C , A , B
where  C.col3 = 5 and  A.col1 = B.col1  and  A.col2 = C.col2
and B.col3 = 10;
Execution Plan
----------------------------------------------------------
0    SELECT STATEMENT Optimizer=CHOOSE (Cost=5 Card=8 Bytes=336)
1 0 HASH JOIN (Cost=5 Card=8 Bytes=336)
2 1    MERGE JOIN (CARTESIAN) (Cost=3 Card=8 Bytes=64)
3 2    TABLE ACCESS (FULL) OF ''B'' (Cost=1 Card=2 Bytes=8)
4 2    SORT (JOIN) (Cost=2 Card=4 Bytes=16)
5 4       TABLE ACCESS (FULL) OF ''C'' (Cost=1 Card=4 Bytes=16)
6 1    TABLE ACCESS (FULL) OF ''A'' (Cost=1 Card=30 Bytes=1020)

select /*+ ORDERED */ A.col4
from C , A , B
where  C.col3 = 5 and  A.col1 = B.col1  and  A.col2 = C.col2
and B.col3 = 10;
Execution Plan
----------------------------------------------------------
0    SELECT STATEMENT Optimizer=CHOOSE (Cost=5 Card=9 Bytes=378)
1 0 HASH JOIN (Cost=5 Card=9 Bytes=378)
2 1    HASH JOIN (Cost=3 Card=30 Bytes=1140)
3 2    TABLE ACCESS (FULL) OF ''C'' (Cost=1 Card=4 Bytes=16)
4 2    TABLE ACCESS (FULL) OF ''A'' (Cost=1 Card=30 Bytes=1020)
5 1    TABLE ACCESS (FULL) OF ''B'' (Cost=1 Card=2 Bytes=8)

select /*+ ORDERED USE_NL (A C)*/ A.col4
from C , A , B
where  C.col3 = 5 and  A.col1 = B.col1  and  A.col2 = C.col2
and B.col3 = 10;
Execution Plan
----------------------------------------------------------
0    SELECT STATEMENT Optimizer=CHOOSE (Cost=7 Card=9 Bytes=378)
1 0 HASH JOIN (Cost=7 Card=9 Bytes=378)
2 1    NESTED LOOPS (Cost=5 Card=30 Bytes=1140)
3 2    TABLE ACCESS (FULL) OF ''C'' (Cost=1 Card=4 Bytes=16)
4 2    TABLE ACCESS (FULL) OF ''A'' (Cost=1 Card=30 Bytes=1020)
5 1    TABLE ACCESS (FULL) OF ''B'' (Cost=1 Card=2 Bytes=8)

select /*+ USE_NL (A C)*/ A.col4
from C , A , B
where  C.col3 = 5 and  A.col1 = B.col1  and  A.col2 = C.col2
and B.col3 = 10;
Execution Plan
----------------------------------------------------------
0    SELECT STATEMENT Optimizer=CHOOSE (Cost=7 Card=9 Bytes=378)
1 0 HASH JOIN (Cost=7 Card=9 Bytes=378)
2 1    NESTED LOOPS (Cost=5 Card=30 Bytes=1140)
3 2    TABLE ACCESS (FULL) OF ''C'' (Cost=1 Card=4 Bytes=16)
4 2    TABLE ACCESS (FULL) OF ''A'' (Cost=1 Card=30 Bytes=1020)
5 1    TABLE ACCESS (FULL) OF ''B'' (Cost=1 Card=2 Bytes=8)

select /*+ ORDERED USE_NL (A B C) */ A.col4
from C , A , B
where  C.col3 = 5 and  A.col1 = B.col1  and  A.col2 = C.col2
and B.col3 = 10;
Execution Plan
----------------------------------------------------------
0    SELECT STATEMENT Optimizer=CHOOSE (Cost=35 Card=9 Bytes=378)
1 0 NESTED LOOPS (Cost=35 Card=9 Bytes=378)
2 1    NESTED LOOPS (Cost=5 Card=30 Bytes=1140)
3 2    TABLE ACCESS (FULL) OF ''C'' (Cost=1 Card=4 Bytes=16)
4 2    TABLE ACCESS (FULL) OF ''A'' (Cost=1 Card=30 Bytes=1020)
5 1    TABLE ACCESS (FULL) OF ''B'' (Cost=1 Card=2 Bytes=8)

　　对于这个查询我无论如何也没有得到类似下面这样的执行计划：
Execution Plan
----------------------------------------------------------
0    SELECT STATEMENT Optimizer=CHOOSE (Cost=35 Card=9 Bytes=378)
1 0 NESTED LOOPS (Cost=35 Card=9 Bytes=378)
2 1    TABLE ACCESS (FULL) OF ''B'' (Cost=1 Card=2 Bytes=8)
3 1    NESTED LOOPS (Cost=5 Card=30 Bytes=1140)
4 3    TABLE ACCESS (FULL) OF ''C'' (Cost=1 Card=4 Bytes=16)
5 3    TABLE ACCESS (FULL) OF ''A'' (Cost=1 Card=30 Bytes=1020)

   从上面的这些例子我们可以看出：通过给语句添加HINTS，让其按照我们的意愿执行，有时是一件很困难的事情，需要不断的尝试各种不同的hints。对于USE_NL与USE_HASH提示，建议同ORDERED提示一起使用，否则不容易指定那个表为驱动表。

关注我们