索引优劣势

优势

  • 类似大学图书馆建书目录索引,提高数据检索的效率,降低数据库的IO成本。
  • 通过索引列对数据进行排序,降低数据排序的成本,降低了CPU的消耗。

    劣势

  • 索引也是一张表,该表保存了主键与索引字段,并指向试题表的记录,所以索引列也是要占用空间的。

  • 虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行insert、update、delete。因为更新表时,mysql不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,调整因为更新所带来的键值变化后的索引信息。
  • 索引只是提高效率的一个因素,如果存在大数据量的表,就需要花时间研究建立最优秀的索引。

    索引分类

    单值索引

    一个索引只包含单个列,一个表可以有多个单列索引。

    唯一索引

    索引列的值必须唯一,但允许空值。

    复合索引

    一个索引包含多个列。

    索引数据结构

    https://www.cs.usfca.edu/~galles/visualization/Algorithms.html

  • 二叉树

  • 红黑树
  • Hash表
  • B-Tree>B+Tree

    B-Tree

  • 叶节点具有相同的深度,叶节点的指针为空。

  • 所有索引元素不重复。
  • 节点中的数据索引从左到右递增排列。

image.png

B+Tree(mysql底层索引)

  • 非叶子节点不存储data,只存储索引(冗余),可以放更多的索引。
  • 叶子节点包含所有的索引字段。
  • 叶子节点用指针连接,提高区间访问的性能。

image.png

索引取舍

哪些情况需要创建索引

  • 主键自动建立唯一索引。
  • 频繁作为查询条件的字段应该创建索引。
  • 查询中与其它表关联的字段,外键关系建立索引。
  • 在高并发下更适合创建组合索引。
  • 查询中排序的字段若通过索引去访问将大大提高排序速度。
  • 查询中统计或者分组的字段。

    哪些情况不需要创建索引

  • 频繁更新的字段不适合创建索引。

  • where条件里用不到的字段不创建索引。
  • 数据重复且分布平均的表字段,因此应该只为最经常查询和最经常排序的数据列建立索引。