服务器 频道

经验技巧:Oracle中优化SQL的原则

三、不可优化的where子句
  
  1.例:下列SQL条件语句中的列都建有恰当的索引,但执行速度却非常慢:
  
  select * from record where
  substring(card_no,1,4)=''5378''(13秒)
  select * from record where
  amount/30< 1000(11秒)
  select * from record where
  convert(char(10),date,112)=''19991201''(10秒)
  分析:
  where子句中对列的任何操作结果都是在SQL运行时逐列计算得到的,因此它不得不进行表搜索,而没有使用该列上面的索引;如果这些结果在查询编译时就能得到,那么就可以被SQL优化器优化,使用索引,避免表搜索,因此将SQL重写成下面这样:
  
  select * from record where card_no like
  ''5378%''(< 1秒)
  select * from record where amount
  < 1000*30(< 1秒)
  select * from record where date= ''1999/12/01''
  (< 1秒)
  
  你会发现SQL明显快起来!
  
  2.例:表stuff有200000行,id_no上有非群集索引,请看下面这个SQL:
  
  select count(*) from stuff where id_no in(''0'',''1'')
  (23秒)
  分析:
  where条件中的''in''在逻辑上相当于''or'',所以语法分析器会将in (''0'',''1'')转化为id_no =''0'' or id_no=''1''来执行。我们期望它会根据每个or子句分别查找,再将结果相加,这样可以利用id_no上的索引;但实际上(根据showplan),它却采用了"OR策略",即先取出满足每个or子句的行,存入临时数据库的工作表中,再建立唯一索引以去掉重复行,最后从这个临时表中计算结果。因此,实际过程没有利用id_no上索引,并且完成时间还要受tempdb数据库性能的影响。
  
  实践证明,表的行数越多,工作表的性能就越差,当stuff有620000行时,执行时间竟达到220秒!还不如将or子句分开:
  
  select count(*) from stuff where id_no=''0''
  select count(*) from stuff where id_no=''1''
  得到两个结果,再作一次加法合算。因为每句都使用了索引,执行时间只有3秒,在620000行下,时间也只有4秒。或者,用更好的方法,写一个简单的存储过程:
  create proc count_stuff as
  declare @a int
  declare @b int
  declare @c int
  declare @d char(10)
  begin
  select @a=count(*) from stuff where id_no=''0''
  select @b=count(*) from stuff where id_no=''1''
  end
  select @c=@a+@b
  select @d=convert(char(10),@c)
  print @d
  
  直接算出结果,执行时间同上面一样快!
  
  总结:
  
  可见,所谓优化即where子句利用了索引,不可优化即发生了表扫描或额外开销。
  
  1.任何对列的操作都将导致表扫描,它包括数据库函数、计算表达式等等,查询时要尽可能将操作移至等号右边。
  
  2.in、or子句常会使用工作表,使索引失效;如果不产生大量重复值,可以考虑把子句拆开;拆开的子句中应该包含索引。
  
  3.要善于使用存储过程,它使SQL变得更加灵活和高效。
  
  从以上这些例子可以看出,SQL优化的实质就是在结果正确的前提下,用优化器可以识别的语句,充份利用索引,减少表扫描的I/O次数,尽量避免表搜索的发生。其实SQL的性能优化是一个复杂的过程,上述这些只是在应用层次的一种体现,深入研究还会涉及数据库层的资源配置、网络层的流量控制以及操作系统层的总体设计。
0
相关文章