SQL 索引

列与列对比

某个表中,有两列(id和c_id)都建了单独索引,下面这种查询条件不会走索引

  1. select * from test where id=c_id;

这种情况会被认为还不如走全表扫描。

存在NULL值条件

在设计数据库表时,应该尽力避免NULL值出现,如果非要不可避免的要出现NULL值,也要给一个DEFAULT值,数值型可以给0、-1之类的, 字符串有时候给空串有问题,就给一个空格或其他。
如果索引列是可空的,很可能是不会给其建索引的,索引值是少于表的count(*)值的,所以这种情况下,执行计划自然就去扫描全表了。

  1. select * from test where id is not null;

NOT条件

建立索引时,给每一个索引列建立一个条目,如果查询条件为等值或范围查询时,索引可以根据查询条件去找对应的条目。
反过来当查询条件为非时,索引定位就困难了,执行计划此时可能更倾向于全表扫描,这类的查询条件有:<>NOTinnot exists

  1. select * from test where id<>500;
  2. select * from test where id in (1,2,3,4,5);
  3. select * from test where not in (6,7,8,9,0);
  4. select * from test where not exists (select 1 from test_02 where test_02.id=test.id);

LIKE通配符

当使用模糊搜索时,尽量采用后置的通配符,例如:name||'%',因为走索引时,其会从前去匹配索引列,这时候是可以找到的,如果采用前匹配,那么查索引就会很麻烦,比如查询所有姓张的人,就可以去搜索'张%'
相反如果查询所有叫‘明’的人,那么只能是%明。这时候索引如何定位呢?前匹配的情况下,执行计划会更倾向于选择全表扫描。后匹配可以走INDEX RANGE SCAN。
所以业务设计的时候,尽量考虑到模糊搜索的问题,要更多的使用后置通配符。

  1. select * from test where name like 张||'%';

条件上包括函数

查询条件上尽量不要对索引列使用函数,比如下面这个SQL

  1. select * from test where upper(name)='FCANT';

这样是不会走索引的,因为索引在建立时会和计算后可能不同,无法定位到索引。但如果查询条件不是对索引列进行计算,那么依然可以走索引。比如

  1. select * from test where name=upper('fcant');
  2. --INDEX RANGE SCAN

这样的函数还有:to_charto_dateto_numbertrunc等。

复合索引前导列区分大

当复合索引前导列区分小的时候,有INDEX SKIP SCAN,当前导列区分度大,且查后导列的时候,前导列的分裂会非常耗资源,执行计划想,还不如全表扫描来的快,然后就索引失效了。

  1. select * from test where owner='admin';

数据类型的转换

当查询条件存在隐式转换时,索引会失效。比如在数据库里id存的number类型,但是在查询时,却用了下面的形式:

  1. select * from test where id='123';

Connect By Level

使用connect by level时,不会走索引。
谓词运算
在上面说,不能对索引列进行函数运算,这也包括加减乘除的谓词运算,这也会使索引失效。建立一个test表,索引为id,看这个SQL:

  1. select * from test where id/2=:type_id;

这里很明显对索引列id进行了'/2'除二运算,这时候就会索引失效,这种情况应该改写为:

  1. select * from test where id=:type_id*2;

就可以使用索引了。

Vistual Index

先说明一下,虚拟索引的建立是否有用,需要看具体的执行计划,如果起作用就可以建一个,如果不起作用就算了。
普通索引这么建:

  1. create index idx_test_id on test(id);

虚拟索引Vistual Index这么建:

  1. create index idx_test_id on test(id) nosegment;

做了一个实验,首先创建一个表:

  1. CREATE TABLE test_1116(
  2. id number,
  3. a number
  4. );
  5. CREATE INDEX idx_test_1116_id on test_1116(id);
  6. CREATE INDEX idx_test_1116_a on test_1116(a)nosegment;

其中id为普通索引,a为虚拟索引。
在表中插入十万条数据

  1. begin
  2. for i in 1 .. 100000 loop
  3. insert into test_1116 values (i,i);
  4. end loop;
  5. commit;
  6. end;

接着分别去执行下面的SQL看时间。

  1. select count(id) from test_1116;
  2. --第一次耗时:0.061
  3. --第二次耗时:0.016
  1. select count(a) from test_1116;
  2. --第一次耗时:0.031
  3. --第二次耗时:0.016

因为在执行过一次后,oracle对结果集缓存了,所以第二次执行耗时不走索引,走内存就都一样了。可以看到在这种情况下,虚拟索引比普通索引快了一倍。
具体虚拟索引的使用细节,这里不再展开讨论。

Invisible Index

Invisible Index是oracle 11g提供的新功能,对优化器(还接到前面博客里讲到的CBO吗)不可见,这个功能更主要的是测试用,假如一个表上有那么多索引,一个一个去看执行计划调试就很慢了,这时候不如建一个对表和查询都没有影响的Invisible Index来进行调试,就显得很好了。
通过下面的语句来操作索引

  1. alter index idx_test_id invisible;
  2. alter index idx_test_id visible;

如果想让CBO看到Invisible Index,需要加入这句:

  1. alter session set optimizer_use_invisible_indexes = true;