概述
SQL 存储过程和视图类似,都是 SQL 中的一个重要概念。
SQL 存储过程的目的也是对 SQL 代码进行封装从而可以反复利用。它和视图有同样的优点:清晰、安全、减少网络传输量。
但是它和视图也有明显的差异,视图是虚拟表,通常不对底层数据表直接操作,而存储过程是程序化的 SQL,可以直接操作底层数据表,相比于面向表的操作方式,能够实现一些更复杂的数据处理。
存储过程可以说是由 SQL 语句和流控制语句构成的语句集合,它和我们之前学到的函数一样,可以接收输入参数,也可以返回输出参数给调用者,返回计算结果。
存储过程介绍
存储过程的英文是 Stored Procedure,它就是 SQL 语句的封装。一旦存储过程被创建出来,使用它就像使用函数一样简单,我们直接通过调用存储过程名即可。
我们先来看一下如何创建一个简单的存储过程:
CREATE PROCEDURE 存储过程名称([参数列表])
BEGIN
需要执行的语句
END
- 首先,我们使用 CREATE PROCEDURE 创建一个存储过程;
- 接下来是存储过程的名称和对应的参数列表,可以包括输入参数和输出参数;
- 最后由 BEGIN 和 END 来定义我们所要执行的语句块。
和视图一样,我们也可以用 ALTER PROCEDURE 和 DROP PROCEDURE 对存储过程进行修改和删除。
下面,我们来以一个简单的存储过程为例进行演示。比如我想做一个累加运算,计算 1+2+…+n 等于多少,我们可以通过参数 n 来表示想要累加的个数,那么如何用存储过程实现呢?
DELIMITER //
CREATE PROCEDURE `add_num`(IN n INT)
BEGIN
DECLARE i INT;
DECLARE sum INT;
SET i = 1;
SET sum = 0;
WHILE i <= n DO
SET sum = sum + i;
SET i = i +1;
END WHILE;
SELECT sum;
END //
DELIMITER ;
其中,我们使用 DELIMITER 定义了存储过程结束的结束符为 // ,并且在 END 之后使用 // 标识存储过程结束。
创建完成存储过程后,我们就可以直接调用该存储过程进行计算了:
CALL add_num(50);
存储过程中的参数
在刚才的存储过程中,我们使用了 IN 类型的参数,另外还有 OUT 类型和 INOUT 类型,它们的作用如下:
我们以我们之前讲过的王者荣耀的英雄数据表 heros。假设我想创建一个存储类型 get_hero_scores,用来查询某一类型英雄中的最大的最大生命值,最小的最大魔法值,以及平均最大攻击值,那么该怎么写呢?
CREATE PROCEDURE `get_hero_scores`(
OUT max_max_hp FLOAT,
OUT min_max_mp FLOAT,
OUT avg_max_attack FLOAT,
s VARCHAR(255)
)
BEGIN
SELECT MAX(hp_max), MIN(mp_max), AVG(attack_max) FROM heros WHERE role_main = s INTO max_max_hp, min_max_mp, avg_max_attack;
END
然后我们就可以调用存储过程,使用下面这段代码即可:
CALL get_hero_scores(@max_max_hp, @min_max_mp, @avg_max_attack, '战士');
SELECT @max_max_hp, @min_max_mp, @avg_max_attack;
流控制语句
流控制语句是用来做流程控制的,在上面的两个例子中,我们使用了下面的流控制语句:
- BEGIN…END:中间包含了多个语句,每个语句都以(;)号为结束符。
- DECLARE:用来声明变量,使用的位置在于 BEGIN…END 语句中间,而且需要在其他语句使用之前进行变量的声明。
- SET:赋值语句,用于对变量进行赋值。
- SELECT…INTO:把从数据表中查询的结果存放到变量中,也就是为变量赋值。
- WHILE…DO…END WHILE:循环语句,先进行条件判断,如果满足条件就进行循环,如果不满足条件就退出循环。
除了上述用到的流控制语句之外,常见的流控制语句还包括:
- IF…THEN…ENDIF:条件判断语句,我们还可以在 IF…THEN…ENDIF 中使用 ELSE 和 ELSEIF 来进行条件判断。
CASE:CASE 语句用于多条件的分支判断。
CASE
WHEN expression1 THEN ...
WHEN expression2 THEN ...
...
ELSE
--ELSE语句可以加,也可以不加。加的话代表的所有条件都不满足时采用的方式。
END
LOOP、LEAVE 和 ITERATE:LOOP 是循环语句,使用 LEAVE 可以跳出循环,使用 ITERATE 则可以进入下一次循环。如果你有面向过程的编程语言的使用经验,你可以把 LEAVE 理解为 BREAK,把 ITERATE 理解为 CONTINUE。
REPEAT…UNTIL…END REPEAT:这是一个循环语句,首先会执行一次循环,然后在 UNTIL 中进行表达式的判断,如果满足条件就退出,即 END REPEAT;如果条件不满足,则会就继续执行循环,直到满足退出条件为止。
存储过程使用注意事项
虽然存储过程有一定的价值,但是关于存储过程的使用其实确有着很大的争议。很多大公司的开发手册中会明确禁用存储过程。
我们先来分析一下存储过程有哪些优缺点吧。
优点如下:存储过程可以一次编译多次使用,提供 SQL 的执行效率;
- 它可以减少开发工作量。将代码封装成模块,在减少开发工作量的同时,还能保证代码的结构清晰。
- 存储过程的安全性强,我们在设定存储过程的时候可以设置对用户的使用权限,这样就和视图一样具有较强的安全性。
- 可以减少网络传输量,因为代码封装到存储过程中,每次使用只需要调用存储过程即可,这样就减少了网络传输量。
当然,存储过程也包含一些缺点,需要的缺点如下:
- 可移植性差,存储过程不能跨数据库移植,比如在 MySQL、Oracle 和 SQL Server 里编写的存储过程,在换成其他数据库时都需要重新编写。
- 调试困难,只有少数 DBMS 支持存储过程的调试。对于复杂的存储过程来说,开发和维护都不容易。
- 版本管理困难,比如数据表索引发生变化了,可能会导致存储过程失效。
- 不适合高并发的场景,高并发的场景需要减少数据库的压力,有时数据库会采用分库分表的方式,而且对可扩展性要求很高,在这种情况下,存储过程会变得难以维护,增加数据库的压力,显然就不适用了。
具体到你们的使用场景,可以结合公司要求和实际需求来进行判断是否需要使用存储过程,不过了解一些总是没有坏处的。