MySQL高级 - Mysql高级-day01 - 《Java 编程》

MySQL高级课程简介
一、索引

资料来源：https://www.bilibili.com/video/BV1zJ411M7TB?p=4

MySQL高级课程简介

序号	Day01	Day02	Day03	Day04
1	Linux系统安装MySQL	体系结构	应用优化	MySQL 常用工具
2	索引	存储引擎	查询缓存优化	MySQL 日志
3	视图	优化SQL步骤	内存管理及优化	MySQL 主从复制
4	存储过程和函数	索引使用	MySQL锁问题	综合案例
5	触发器	SQL优化	常用SQL技巧

一、索引

1、索引概述

MySQL官方对索引的定义为：索引（index）是帮助MySQL高效获取数据的数据结构（有序）。在数据之外，数据库系统还维护者满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级查找算法，这种数据结构就是索引。如下面的示意图所示 :

左边是数据表，一共有两列七条记录，最左边的是数据记录的物理地址（注意逻辑上相邻的记录在磁盘上也并不是一定物理相邻的）。为了加快Col2的查找，可以维护一个右边所示的二叉查找树，每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针，这样就可以运用二叉查找快速获取到相应数据。
一般来说索引本身也很大，不可能全部存储在内存中，因此索引往往以索引文件的形式存储在磁盘上。索引是数据库中用来提高性能的最常用的工具。

2、索引优势与劣势

优势：
1）类似于书籍的目录索引，提高数据检索的效率，降低数据库的IO成本。
2）通过索引列对数据进行排序，降低数据排序的成本，降低CPU的消耗。

劣势：
1）实际上索引也是一张表，该表中保存了主键与索引字段，并指向实体类的记录，所以索引列也是要占用空间的。
2）虽然索引大大提高了查询效率，同时却也降低更新表的速度，如对表进行INSERT、UPDATE、DELETE。因为更新表时，MySQL 不仅要保存数据，还要保存一下索引文件每次更新添加了索引列的字段，都会调整因为更新所带来的键值变化后的索引信息。

3、索引结构

索引是在MySQL的存储引擎层中实现的，而不是在服务器层实现的。所以每种存储引擎的索引都不一定完全相同，也不是所有的存储引擎都支持所有的索引类型的。
MySQL目前提供了以下4种索引：

BTREE 索引：最常见的索引类型，大部分索引都支持 B 树索引。
HASH 索引：只有Memory引擎支持，使用场景简单。
R-tree 索引（空间索引）：空间索引是MyISAM引擎的一个特殊索引类型，主要用于地理空间数据类型，通常使用较少，不做特别介绍。
Full-text （全文索引）：全文索引也是MyISAM的一个特殊索引类型，主要用于全文索引，InnoDB从Mysql5.6版本开始支持全文索引。

MyISAM、InnoDB、Memory三种存储引擎对各种索引类型的支持

索引	InnoDB引擎	MyISAM引擎	Memory引擎
BTREE索引	支持	支持	支持
HASH 索引	不支持	不支持	支持
R-tree 索引	不支持	支持	不支持
Full-text	5.6版本之后支持	支持	不支持

我们平常所说的索引，如果没有特别指明，都是指B+树（多路搜索树，并不一定是二叉的）结构组织的索引。其中聚集索引、复合索引、前缀索引、唯一索引默认都是使用 B+tree 索引，统称为索引。

3.1 BTREE 结构

BTree又叫多路平衡搜索树，一颗m叉的BTree特性如下：

树中每个节点最多包含m个孩子。
除根节点与叶子节点外，每个节点至少有[ceil(m/2)]个孩子。
若根节点不是叶子节点，则至少有两个孩子。
所有的叶子节点都在同一层。
每个非叶子节点由n个key与n+1个指针组成，其中[ceil(m/2)-1] <= n <= m-1

以5叉BTree为例，key的数量：公式推导[ceil(m/2)-1] <= n <= m-1。所以 2 <= n <=4 。当n>4时，中间节点分裂到父节点，两边节点分裂。
插入 C N G A H E K Q M F W L T Z D P R X Y S 数据为例。

演变过程如下：
1). 插入前4个字母 C N G A

2). 插入H，n>4，中间元素G字母向上分裂到新的节点

3). 插入E，K，Q不需要分裂

4). 插入M，中间元素M字母向上分裂到父节点G

5). 插入F，W，L，T不需要分裂

6). 插入Z，中间元素T向上分裂到父节点中

7). 插入D，中间元素D向上分裂到父节点中。然后插入P，R，X，Y不需要分裂

8) 最后插入S，NPQR节点n>5，中间节点Q向上分裂，但分裂后父节点DGMT的n>5，中间节点M向上分裂

到此，该BTREE树就已经构建完成了， BTREE树和二叉树相比，查询数据的效率更高，因为对于相同的数据量来说，BTREE的层级结构比二叉树小，因此搜索速度快。

3.2 B+TREE结构

B+Tree为BTree的变种，B+Tree与BTree的区别为：
1）n叉B+Tree最多含有n个key，而BTree最多含有n-1个key
2）B+Tree的叶子节点保存所有的key信息，依key大小顺序排列
3）所有的非叶子节点都可以看作是key的索引部分

由于B+Tree只有叶子节点保存key信息，查询任何key都要从root走到叶子。所以B+Tree的查询效率更加稳定。

3.3 MySQL中的B+Tree

MySql索引数据结构对经典的B+Tree进行了优化。在原B+Tree的基础上，增加一个指向相邻叶子节点的链表指针，就形成了带有顺序指针的B+Tree，提高区间访问的性能。
MySQL中的 B+Tree 索引结构示意图:

4、索引分类

1）单值索引：即一个索引只包含单个列，一个表可以有多个单列索引
2）唯一索引：索引列的值必须唯一，但允许有空值
3）复合索引：即一个索引包含多个列

5、索引语法

索引在创建表的时候，可以同时创建，也可以随时增加新的索引。

create database demo_01 default charset=utf8mb4;
use demo_01;
CREATE TABLE `city` (
  `city_id` int(11) NOT NULL AUTO_INCREMENT,
  `city_name` varchar(50) NOT NULL,
  `country_id` int(11) NOT NULL,
  PRIMARY KEY (`city_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
CREATE TABLE `country` (
  `country_id` int(11) NOT NULL AUTO_INCREMENT,
  `country_name` varchar(100) NOT NULL,
  PRIMARY KEY (`country_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
insert into `city` (`city_id`, `city_name`, `country_id`) values(1,'西安',1);
insert into `city` (`city_id`, `city_name`, `country_id`) values(2,'NewYork',2);
insert into `city` (`city_id`, `city_name`, `country_id`) values(3,'北京',1);
insert into `city` (`city_id`, `city_name`, `country_id`) values(4,'上海',1);
insert into `country` (`country_id`, `country_name`) values(1,'China');
insert into `country` (`country_id`, `country_name`) values(2,'America');
insert into `country` (`country_id`, `country_name`) values(3,'Japan');
insert into `country` (`country_id`, `country_name`) values(4,'UK');

5.1 创建索引

CREATE     [UNIQUE|FULLTEXT|SPATIAL]  INDEX index_name 
[USING  index_type]
ON tbl_name(index_col_name,...)
index_col_name : column_name[(length)][ASC | DESC]

示例：为city表中的city_name字段创建索引

5.2 查看索引

show index  from  table_name;

示例：查看city表中的索引信息；

5.3 删除索引

DROP  INDEX  index_name  ON  tbl_name;

示例：想要删除city表上的索引idx_city_name，可以操作如下：

5.4 ALTER命令

1). alter  table  tb_name  add  primary  key(column_list); 
    该语句添加一个主键，这意味着索引值必须是唯一的，且不能为NULL
2). alter  table  tb_name  add  unique index_name(column_list);
    这条语句创建索引的值必须是唯一的（除了NULL外，NULL可能会出现多次）
3). alter  table  tb_name  add  index index_name(column_list);
    添加普通索引，索引值可以出现多次。
4). alter  table  tb_name  add  fulltext  index_name(column_list);
    该语句指定了索引为FULLTEXT， 用于全文索引

6、索引设计原则

索引的设计可以遵循一些已有的原则，创建索引的时候请尽量考虑符合这些原则，便于提升索引的使用效率，更高效的使用索引

对查询频次较高，且数据量比较大的表建立索引
索引字段的选择，最佳候选列应当从where子句的条件中提取，如果where子句中的组合比较多，那么应当挑选最常用、过滤效果最好的列的组合
使用唯一索引，区分度越高，使用索引的效率越高
索引可以有效的提升查询数据的效率，但索引数量不是多多益善
- 索引越多，维护索引的代价自然也就水涨船高。对于插入、更新、删除等DML操作比较频繁的表来说，索引过多，会引入相当高的维护代价，降低DML操作的效率，增加相应操作的时间消耗。
- 另外索引过多的话，MySQL也会犯选择困难病，虽然最终仍然会找到一个可用的索引，但无疑提高了选择的代价
使用短索引，索引创建之后也是使用硬盘来存储的，因此提升索引访问的I/O效率，也可以提升总体的访问效率。假如构成索引的字段总长度比较短，那么在给定大小的存储块内可以存储更多的索引值，相应的可以有效的提升MySQL访问索引的I/O效率
利用最左前缀，N个列组合而成的组合索引，那么相当于是创建了N个索引，如果查询时where子句中使用了组成该索引的前几个字段，那么这条查询SQL可以利用组合索引来提升查询效率 ```sql 创建复合索引: CREATE INDEX idx_name_email_status ON tb_seller(NAME, email, STATUS);

就相当于对name创建索引对name、email创建了索引对name、email、status创建了索引

<a name="uIyng"></a>
## 二、存储过程和函数
<a name="EmxtX"></a>
### 1、存储过程和函数概述
    存储过程和函数是 事先经过编译并存储在数据库中的一段 SQL 语句的集合，调用存储过程和函数可以简化应用开发人员的很多工作，减少数据在数据库和应用服务器之间的传输，对于提高数据处理的效率是有好处的。    <br />    存储过程和函数的区别在于函数必须有返回值，而存储过程没有。<br />    函数 ： 是一个有返回值的过程 ；<br />    过程 ： 是一个没有返回值的函数 ；
<a name="x68fD"></a>
### 2、创建存储过程
```sql
CREATE PROCEDURE procedure_name ([proc_parameter[,...]])
begin
    -- SQL语句
end ;

示例：

delimiter $
create procedure pro_test1()
begin
    select 'Hello Mysql' ;
end$
delimiter ;

知识小贴士
DELIMITER
该关键字用来声明SQL语句的分隔符 , 告诉 MySQL 解释器，该段命令是否已经结束了，mysql是否可以执行了。默认情况下，delimiter是分号;。在命令行客户端中，如果有一行命令以分号结束，那么回车后，mysql将会执行该命令。

3、调用存储过程

call procedure_name();

4、查看存储过程

-- 查询db_name数据库中的所有的存储过程
select name from mysql.proc where db='db_name';
-- 查询存储过程的状态信息
show procedure status;
-- 查询某个存储过程的定义
show create procedure test.pro_test1 \G;

5、删除存储过程

DROP PROCEDURE  [IF EXISTS] sp_name；

6、语法

存储过程是可以编程的，意味着可以使用变量，表达式，控制结构，来完成比较复杂的功能。

6.1 变量

DECLARE
- 通过 DECLARE 可以定义一个局部变量，该变量的作用范围只能在 BEGIN…END 块中。

DECLARE var_name[,…] type [DEFAULT value]
示例 :
delimiter $ create procedure pro_test2() begin declare num int default 5; select num+ 10; end$ delimiter ;

直接赋值使用 SET，可以赋常量或者赋表达式，具体语法如下：
SET var_name = expr [, var_name = expr] …
示例 :
DELIMITER $ CREATE PROCEDURE pro_test3() BEGIN DECLARE NAME VARCHAR(20); SET NAME = ‘MYSQL’; SELECT NAME ; END$ DELIMITER ;
也可以通过select … into 方式进行赋值操作 :
DELIMITER $ CREATE PROCEDURE pro_test5() BEGIN declare countnum int; select count(*) into countnum from city; select countnum; END$ DELIMITER ;

6.2 if条件判断

语法结构 :
if search_condition then statement_list [elseif search_condition then statement_list] … [else statement_list] end if;
需求：
根据定义的身高变量，判定当前身高的所属的身材类型 180 及以上 —————> 身材高挑 170 - 180 ————-> 标准身材 170 以下 —————> 一般身材
示例 :

delimiter $
create procedure pro_test6()
begin
  declare  height  int  default  175; 
  declare  description  varchar(50);
  if  height >= 180  then
    set description = '身材高挑';
  elseif height >= 170 and height < 180  then
    set description = '标准身材';
  else
    set description = '一般身材';
  end if;
  select description ;
end$
delimiter ;

调用结果为 :

6.3 传递参数

语法格式 :

create procedure procedure_name([in/out/inout] 参数名   参数类型)
...
IN :   该参数可以作为输入，也就是需要调用方传入值 , 默认
OUT:   该参数作为输出，也就是该参数可以作为返回值
INOUT: 既可以作为输入参数，也可以作为输出参数

IN - 输入
需求 :
根据定义的身高变量，判定当前身高的所属的身材类型
示例 :
delimiter $ create procedure pro_test5(in height int) begin declare description varchar(50) default ‘’; if height >= 180 then set description=’身材高挑’; elseif height >= 170 and height < 180 then set description=’标准身材’; else set description=’一般身材’; end if; select concat(‘身高 ‘, height , ‘对应的身材类型为:’,description); end$ delimiter ;
OUT-输出
需求 :
根据传入的身高变量，获取当前身高的所属的身材类型
示例:
create procedure pro_test5(in height int , out description varchar(100)) begin if height >= 180 then set description=’身材高挑’; elseif height >= 170 and height < 180 then set description=’标准身材’; else set description=’一般身材’; end if; end$
调用:
call pro_test5(168, @description)$ select @description$
小知识
@description : 这种变量要在变量名称前面加上“@”符号，叫做用户会话变量，代表整个会话过程他都是有作用的，这个类似于全局变量一样。
@@global.sort_buffer_size : 这种在变量前加上 “@@” 符号, 叫做系统变量

6.4 case结构

语法结构 :
方式一 : CASE case_value WHEN when_value THEN statement_list [WHEN when_value THEN statement_list] … [ELSE statement_list] END CASE; 方式二 : CASE WHEN search_condition THEN statement_list [WHEN search_condition THEN statement_list] … [ELSE statement_list] END CASE;
需求:
给定一个月份, 然后计算出所在的季度
示例 :
delimiter $ create procedure pro_test9(month int) begin declare result varchar(20); case when month >= 1 and month <=3 then set result = ‘第一季度’; when month >= 4 and month <=6 then set result = ‘第二季度’; when month >= 7 and month <=9 then set result = ‘第三季度’; when month >= 10 and month <=12 then set result = ‘第四季度’; end case; select concat(‘您输入的月份为 :’, month , ‘ , 该月份为 : ‘ , result) as content ; end$ delimiter ;

6.5 while循环

语法结构:
while search_condition do statement_list end while;
需求:
计算从1加到n的值
示例 :
delimiter $ create procedure pro_test8(n int) begin declare total int default 0; declare num int default 1; while num<=n do set total = total + num; set num = num + 1; end while; select total; end$ delimiter ;

6.6 repeat结构

有条件的循环控制语句, 当满足条件的时候退出循环。while 是满足条件才执行，repeat 是满足条件就退出循环。
语法结构 :
REPEAT statement_list UNTIL search_condition END REPEAT;
需求:
计算从1加到n的值
示例 :
delimiter $ create procedure pro_test10(n int) begin declare total int default 0; repeat set total = total + n; set n = n - 1; until n=0 end repeat; select total ; end$ delimiter ;

6.7 loop语句

LOOP 实现简单的循环，退出循环的条件需要使用其他的语句定义，通常可以使用 LEAVE 语句实现，具体语法如下：
[begin_label:] LOOP statement_list END LOOP [end_label]
如果不在 statement_list 中增加退出循环的语句，那么 LOOP 语句可以用来实现简单的死循环。

6.8 leave语句

用来从标注的流程构造中退出，通常和 BEGIN … END 或者循环一起使用。下面是一个使用 LOOP 和 LEAVE 的简单例子 , 退出循环：
delimiter $ CREATE PROCEDURE pro_test11(n int) BEGIN declare total int default 0; ins: LOOP IF n <= 0 then leave ins; END IF; set total = total + n; set n = n - 1; END LOOP ins; select total; END$ delimiter ;

6.9 游标/光标

游标是用来存储查询结果集的数据类型 , 在存储过程和函数中可以使用光标对结果集进行循环的处理。光标的使用包括光标的声明、OPEN、FETCH 和 CLOSE，其语法分别如下。
声明光标：
DECLARE cursor_name CURSOR FOR select_statement ;
OPEN 光标：
OPEN cursor_name ;
FETCH 光标：
FETCH cursor_name INTO var_name [, var_name] …
CLOSE 光标：
CLOSE cursor_name ;
示例 :
初始化脚本:
create table emp( id int(11) not null auto_increment , name varchar(50) not null comment ‘姓名’, age int(11) comment ‘年龄’, salary int(11) comment ‘薪水’, primary key(id) )engine=innodb default charset=utf8 ; insert into emp(id,name,age,salary) values(null,’金毛狮王’,55,3800),(null,’白眉鹰王’,60,4000),(null,’青翼蝠王’,38,2800),(null,’紫衫龙王’,42,1800);
— 查询emp表中数据, 并逐行获取进行展示 create procedure pro_test11() begin declare e_id int(11); declare e_name varchar(50); declare e_age int(11); declare e_salary int(11); declare emp_result cursor for select from emp; open emp_result; fetch emp_result into e_id,e_name,e_age,e_salary; select concat(‘id=’,e_id , ‘, name=’,e_name, ‘, age=’, e_age, ‘, 薪资为: ‘,e_salary); fetch emp_result into e_id,e_name,e_age,e_salary; select concat(‘id=’,e_id , ‘, name=’,e_name, ‘, age=’, e_age, ‘, 薪资为: ‘,e_salary); fetch emp_result into e_id,e_name,e_age,e_salary; select concat(‘id=’,e_id , ‘, name=’,e_name, ‘, age=’, e_age, ‘, 薪资为: ‘,e_salary); fetch emp_result into e_id,e_name,e_age,e_salary; select concat(‘id=’,e_id , ‘, name=’,e_name, ‘, age=’, e_age, ‘, 薪资为: ‘,e_salary); fetch emp_result into e_id,e_name,e_age,e_salary; select concat(‘id=’,e_id , ‘, name=’,e_name, ‘, age=’, e_age, ‘, 薪资为: ‘,e_salary); close emp_result; end$
通过循环结构 , 获取游标中的数据 :
DELIMITER $ create procedure pro_test12() begin DECLARE id int(11); DECLARE name varchar(50); DECLARE age int(11); DECLARE salary int(11); DECLARE has_data int default 1; DECLARE emp_result CURSOR FOR select from emp; DECLARE EXIT HANDLER FOR NOT FOUND set has_data = 0; open emp_result; repeat fetch emp_result into id , name , age , salary; select concat(‘id为’,id, ‘, name 为’ ,name , ‘, age为 ‘ ,age , ‘, 薪水为: ‘, salary); until has_data = 0 end repeat; close emp_result; end$ DELIMITER ;

7、存储函数

语法结构:
CREATE FUNCTION function_name([param type … ]) RETURNS type BEGIN … END;
案例 :
定义一个存储过程, 请求满足条件的总记录数 ;
delimiter $ create function count_city(countryId int) returns int begin declare cnum int ; select count(*) into cnum from city where country_id = countryId; return cnum; end$ delimiter ;
调用:
select count_city(1); select count_city(2);