Mysql一些好的学习资源

Mysql官网 https://dev.mysql.com/doc/
极客时间:Mysql45讲

MySql整体知识体系

MYSQL思维导图

Mysql知识体系 - 图1

MYSQL的基本架构

image.png

概述

Server 层包括连接器、查询缓存、分析器、优化器、执行器等,涵盖 MySQL 的大多数核心服务功能,以及所有的内置函数(如日期、时间、数学和加密函数等),所有跨存储引擎的功能都在这一层实现,比如存储过程、触发器、视图等。
而存储引擎层负责数据的存储和提取。其架构模式是插件式的,支持 InnoDB、MyISAM、Memory 等多个存储引擎。现在最常用的存储引擎是 InnoDB,它从 MySQL 5.5.5 版本开始成为了默认存储引擎。

连接器

如果用户名密码认证通过,连接器会到权限表里面查出你拥有的权限。之后,这个连接里面的权限判断逻辑,都将依赖于此时读到的权限。这就意味着,一个用户成功建立连接后,即使你用管理员账号对这个用户的权限做了修改,也不会影响已经存在连接的权限。修改完成后,只有再新建的连接才会使用新的权限设置。

其实就是 MySQL 里经常说到的 WAL 技术,WAL 的全称
是 Write-Ahead Logging,它的关键点就是先写日志,再写磁盘,也就是先写粉板,等不
忙的时候再写账本。

具体来说,当有一条记录需要更新的时候,InnoDB 引擎就会先把记录写到 redo log(粉
板)里面,并更新内存,这个时候更新就算完成了。同时,InnoDB 引擎会在适当的时候,
将这个操作记录更新到磁盘里面,而这个更新往往是在系统比较空闲的时候做,这就像打烊
以后掌柜做的事。

与此类似,InnoDB 的 redo log 是固定大小的,比如可以配置为一组 4 个文件,每个文件
的大小是 1GB,那么这块“粉板”总共就可以记录 4GB 的操作。从头开始写,写到末尾就
又回到开头循环写,如下面这个图所示。

image.png
write pos 是当前记录的位置,一边写一边后移,写到第 3 号文件末尾后就回到 0 号文件
开头。checkpoint 是当前要擦除的位置,也是往后推移并且循环的,擦除记录前要把记录
更新到数据文件。
write pos 和 checkpoint 之间的是“粉板”上还空着的部分,可以用来记录新的操作。如
果 write pos 追上 checkpoint,表示“粉板”满了,这时候不能再执行新的更新,得停下
来先擦掉一些记录,把 checkpoint 推进一下。
有了 redo log,InnoDB 就可以保证即使数据库发生异常重启,之前提交的记录都不会丢
失,这个能力称为crash-safe。

前面我们讲过,MySQL 整体来看,其实就有两块:一块是 Server 层,它主要做的是
MySQL 功能层面的事情;还有一块是引擎层,负责存储相关的具体事宜。上面我们聊到的
粉板 redo log 是 InnoDB 引擎特有的日志,而 Server 层也有自己的日志,称为
binlog(归档日志)。
我想你肯定会问,为什么会有两份日志呢?
因为最开始 MySQL 里并没有 InnoDB 引擎。MySQL 自带的引擎是 MyISAM,但是
MyISAM 没有 crash-safe 的能力,binlog 日志只能用于归档。而 InnoDB 是另一个公司
以插件形式引入 MySQL 的,既然只依靠 binlog 是没有 crash-safe 能力的,所以 InnoDB
使用另外一套日志系统——也就是 redo log 来实现 crash-safe 能力。

这两种日志有以下三点不同。
1. redo log 是 InnoDB 引擎特有的;binlog 是 MySQL 的 Server 层实现的,所有引擎都
可以使用。
2. redo log 是物理日志,记录的是“在某个数据页上做了什么修改”;binlog 是逻辑日
志,记录的是这个语句的原始逻辑,比如“给 ID=2 这一行的 c 字段加 1 ”。3. redo log 是循环写的,空间固定会用完;binlog 是可以追加写入的。“追加写”是指
binlog 文件写到一定大小后会切换到下一个,并不会覆盖以前的日志

有了对这两个日志的概念性理解,我们再来看执行器和 InnoDB 引擎在执行这个简单的
update 语句时的内部流程。
1. 执行器先找引擎取 ID=2 这一行。ID 是主键,引擎直接用树搜索找到这一行。如果
ID=2 这一行所在的数据页本来就在内存中,就直接返回给执行器;否则,需要先从磁盘
读入内存,然后再返回。
2. 执行器拿到引擎给的行数据,把这个值加上 1,比如原来是 N,现在就是 N+1,得到新
的一行数据,再调用引擎接口写入这行新数据。
3. 引擎将这行新数据更新到内存中,同时将这个更新操作记录到 redo log 里面,此时
redo log 处于 prepare 状态。然后告知执行器执行完成了,随时可以提交事务。
4. 执行器生成这个操作的 binlog,并把 binlog 写入磁盘。
image.png两阶段提交
为什么必须有“两阶段提交”呢?这是为了让两份日志之间的逻辑一致。要说明这个问题,
我们得从文章开头的那个问题说起:怎样让数据库恢复到半个月内任意一秒的状态?
前面我们说过了,binlog 会记录所有的逻辑操作,并且是采用“追加写”的形式。如果你
的 DBA 承诺说半个月内可以恢复,那么备份系统中一定会保存最近半个月的所有
binlog,同时系统会定期做整库备份。这里的“定期”取决于系统的重要性,可以是一天
一备,也可以是一周一备。
当需要恢复到指定的某一秒时,比如某天下午两点发现中午十二点有一次误删表,需要找回
数据,那你可以这么做:
首先,找到最近的一次全量备份,如果你运气好,可能就是昨天晚上的一个备份,从这个
备份恢复到临时库;
然后,从备份的时间点开始,将备份的 binlog 依次取出来,重放到中午误删表之前的那
个时刻。
这样你的临时库就跟误删之前的线上库一样了,然后你可以把表数据从临时库取出来,按需
要恢复到线上库去。

使用反证法证明为什么要采用二阶段提交
1. 先写 redo log 后写 binlog。假设在 redo log 写完,binlog 还没有写完的时候,
MySQL 进程异常重启。由于我们前面说过的,redo log 写完之后,系统即使崩溃,仍
然能够把数据恢复回来,所以恢复后这一行 c 的值是 1。
但是由于 binlog 没写完就 crash 了,这时候 binlog 里面就没有记录这个语句。因此,
之后备份日志的时候,存起来的 binlog 里面就没有这条语句。
然后你会发现,如果需要用这个 binlog 来恢复临时库的话,由于这个语句的 binlog 丢
失,这个临时库就会少了这一次更新,恢复出来的这一行 c 的值就是 0,与原库的值不
同。
2. 先写 binlog 后写 redo log。如果在 binlog 写完之后 crash,由于 redo log 还没写,
崩溃恢复以后这个事务无效,所以这一行 c 的值是 0。但是 binlog 里面已经记录了“把
c 从 0 改成 1”这个日志。所以,在之后用 binlog 来恢复的时候就多了一个事务出来,
恢复出来的这一行 c 的值就是 1,与原库的值不同。
可以看到,如果不使用“两阶段提交”,那么数据库的状态就有可能和用它的日志恢复出来
的库的状态不一致。

可以看到不管使用什么顺序,没有用二阶段提交的方式,数据可能会导致与元库的值不同。

你可能会说,这个概率是不是很低,平时也没有什么动不动就需要恢复临时库的场景呀?
其实不是的,不只是误操作后需要用这个过程来恢复数据。当你需要扩容的时候,也就是需
要再多搭建一些备库来增加系统的读能力的时候,现在常见的做法也是用全量备份加上应用
binlog 来实现的,这个“不一致”就会导致你的线上出现主从数据库不一致的情况。
简单说,redo log 和 binlog 都可以用于表示事务的提交状态,而两阶段提交就是让这两
个状态保持逻辑上的一致。

Redo log不是记录数据页“更新之后的状态”,而是记录这个页 “做了什么改动”。 Binlog有两种模式,statement 格式的话是记sql语句, row格式会记录行的内容,记两条,更新 前和更新后都有。

今天,我介绍了 MySQL 里面最重要的两个日志,即物理日志 redo log 和逻辑日志
binlog。
redo log 用于保证 crash-safe 能力。innodb_flush_log_at_trx_commit 这个参数设置成
1 的时候,表示每次事务的 redo log 都直接持久化到磁盘。这个参数我建议你设置成 1,
这样可以保证 MySQL 异常重启之后数据不丢失。
sync_binlog 这个参数设置成 1 的时候,表示每次事务的 binlog 都持久化到磁盘。这个参
数我也建议你设置成 1,这样可以保证 MySQL 异常重启之后 binlog 不丢失。我还跟你介绍了与 MySQL 日志系统密切相关的“两阶段提交”。两阶段提交是跨系统维
持数据逻辑一致性时常用的一个方案,即使你不做数据库内核开发,日常开发中也有可能会
用到。(比如分布式事物,分布式共识算法等等)

binlog还不能去掉。
一个原因是,redolog只有InnoDB有,别的引擎没有。另一个原因是,redolog是循环写的,不持久保存,binlog的“归档”这个功能,redolog是不具
备的。

隔离性与隔离级别
提到事务,你肯定会想到 ACID(Atomicity、Consistency、Isolation、Durability,即原
子性、一致性、隔离性、持久性),今天我们就来说说其中 I,也就是“隔离性”。
当数据库上有多个事务同时执行的时候,就可能出现脏读(dirty read)、不可重复读
(non-repeatable read)、幻读(phantom read)的问题,为了解决这些问题,就有
了“隔离级别”的概念。

在谈隔离级别之前,你首先要知道,你隔离得越严实,效率就会越低。因此很多时候,我们
都要在二者之间寻找一个平衡点。SQL 标准的事务隔离级别包括:读未提交(read
uncommitted)、读提交(read committed)、可重复读(repeatable read)和串行化
(serializable )。下面我逐一为你解释:
读未提交是指,一个事务还没提交时,它做的变更就能被别的事务看到。
读提交是指,一个事务提交之后,它做的变更才会被其他事务看到。
可重复读是指,一个事务执行过程中看到的数据,总是跟这个事务在启动时看到的数据是
一致的。当然在可重复读隔离级别下,未提交变更对其他事务也是不可见的。
串行化,顾名思义是对于同一行记录,“写”会加“写锁”,“读”会加“读锁”。当出
现读写锁冲突的时候,后访问的事务必须等前一个事务执行完成,才能继续执行。
其中“读提交”和“可重复读”比较难理解,所以我用一个例子说明这几种隔离级别。假设
数据表 T 中只有一列,其中一行的值为 1,下面是按照时间顺序执行两个事务的行为。

image.png
若隔离级别是“读未提交”, 则 V1 的值就是 2。这时候事务 B 虽然还没有提交,但是
结果已经被 A 看到了。因此,V2、V3 也都是 2。若隔离级别是“读提交”,则 V1 是 1,V2 的值是 2。事务 B 的更新在提交后才能被 A
看到。所以, V3 的值也是 2。
若隔离级别是“可重复读”,则 V1、V2 是 1,V3 是 2。之所以 V2 还是 1,遵循的就
是这个要求:事务在执行期间看到的数据前后必须是一致的。
若隔离级别是“串行化”,则在事务 B 执行“将 1 改成 2”的时候,会被锁住。直到事
务 A 提交后,事务 B 才可以继续执行。所以从 A 的角度看, V1、V2 值是 1,V3 的值
是 2。
在实现上,数据库里面会创建一个视图,访问的时候以视图的逻辑结果为准。在“可重复
读”隔离级别下,这个视图是在事务启动时创建的,整个事务存在期间都用这个视图。
在“读提交”隔离级别下,这个视图是在每个 SQL 语句开始执行的时候创建的。这里需要
注意的是,“读未提交”隔离级别下直接返回记录上的最新值,没有视图概念;而“串行
化”隔离级别下直接用加锁的方式来避免并行访问。
我们可以看到在不同的隔离级别下,数据库行为是有所不同的。Oracle 数据库的默认隔离
级别其实就是“读提交”,因此对于一些从 Oracle 迁移到 MySQL 的应用,为保证数据库
隔离级别的一致,你一定要记得将 MySQL 的隔离级别设置为“读提交”。

总结来说,存在即合理,哪个隔离级别都有它自己的使用场景,你要根据自己的业务情况来
定。我想你可能会问那什么时候需要“可重复读”的场景呢?我们来看一个数据校对逻辑的案例。
假设你在管理一个个人银行账户表。一个表存了每个月月底的余额,一个表存了账单明细。
这时候你要做数据校对,也就是判断上个月的余额和当前余额的差额,是否与本月的账单明
细一致。你一定希望在校对过程中,即使有用户发生了一笔新的交易,也不影响你的校对结
果。
这时候使用“可重复读”隔离级别就很方便。事务启动时的视图可以认为是静态的,不受其
他事务更新的影响。

事务隔离的实现

理解了事务的隔离级别,我们再来看看事务隔离具体是怎么实现的。这里我们展开说明“可
重复读”。
image.png
在 MySQL 中,实际上每条记录在更新的时候都会同时记录一条回滚操作。记录上的最新
值,通过回滚操作,都可以得到前一个状态的值。
假设一个值从 1 被按顺序改成了 2、3、4,在回滚日志里面就会有类似下面的记录。当前值是 4,但是在查询这条记录的时候,不同时刻启动的事务会有不同的 read-view。如
图中看到的,在视图 A、B、C 里面,这一个记录的值分别是 1、2、4,同一条记录在系统
中可以存在多个版本,就是数据库的多版本并发控制(MVCC)。对于 read-view A,要
得到 1,就必须将当前值依次执行图中所有的回滚操作得到。
同时你会发现,即使现在有另外一个事务正在将 4 改成 5,这个事务跟 read-view A、B、
C 对应的事务是不会冲突的。
你一定会问,回滚日志总不能一直保留吧,什么时候删除呢?答案是,在不需要的时候才删
除。也就是说,系统会判断,当没有事务再需要用到这些回滚日志时,回滚日志会被删除。
什么时候才不需要了呢?就是当系统里没有比这个回滚日志更早的 read-view 的时候。

基于上面的说明,我们来讨论一下为什么建议你尽量不要使用长事务。
长事务意味着系统里面会存在很老的事务视图。由于这些事务随时可能访问数据库里面的任
何数据,所以这个事务提交之前,数据库里面它可能用到的回滚记录都必须保留,这就会导
致大量占用存储空间。
在 MySQL 5.5 及以前的版本,回滚日志是跟数据字典一起放在 ibdata 文件里的,即使长
事务最终提交,回滚段被清理,文件也不会变小。我见过数据只有 20GB,而回滚段有
200GB 的库。最终只好为了清理回滚段,重建整个库。
除了对回滚段的影响,长事务还占用锁资源,也可能拖垮整个库,这个我们会在后面讲锁的
时候展开。

事务的启动方式

如前面所述,长事务有这些潜在风险,我当然是建议你尽量避免。其实很多时候业务开发同
学并不是有意使用长事务,通常是由于误用所致。MySQL 的事务启动方式有以下几种:

1. 显式启动事务语句, begin 或 start transaction。配套的提交语句是 commit,回滚语
句是 rollback。
2. set autocommit=0,这个命令会将这个线程的自动提交关掉。意味着如果你只执行一
个 select 语句,这个事务就启动了,而且并不会自动提交。这个事务持续存在直到你主动执行 commit 或 rollback 语句,或者断开连接。

有些客户端连接框架会默认连接成功后先执行一个 set autocommit=0 的命令。这就导致
接下来的查询都在事务中,如果是长连接,就导致了意外的长事务。
因此,我会建议你总是使用 set autocommit=1, 通过显式语句的方式来启动事务。
但是有的开发同学会纠结“多一次交互”的问题。对于一个需要频繁使用事务的业务,第二
种方式每个事务在开始时都不需要主动执行一次 “begin”,减少了语句的交互次数。如
果你也有这个顾虑,我建议你使用 commit work and chain 语法。
在 autocommit 为 1 的情况下,用 begin 显式启动的事务,如果执行 commit 则提交事
务。如果执行 commit work and chain,则是提交事务并自动启动下一个事务,这样也省
去了再次执行 begin 语句的开销。同时带来的好处是从程序开发的角度明确地知道每个语
句是否处于事务中。
你可以在 information_schema 库的 innodb_trx 这个表中查询长事务,比如下面这个语
句,用于查找持续时间超过 60s 的事务。

  1. select * from information_schema.innodb_trx where TIME_TO_SEC(timediff(now(),trx_started)) > 60

我给你留一个问题吧。你现在知道了系统里面应该避免长事务,如果你是业务开发负责人同
时也是数据库负责人,你会有什么方案来避免出现或者处理这种情况呢?

如何避免长事务

首先,从应用开发端来看:

  1. 确认是否使用了 set autocommit=0。这个确认工作可以在测试环境中开展,把
    MySQL 的 general_log 开起来,然后随便跑一个业务逻辑,通过 general_log 的日志
    来确认。一般框架如果会设置这个值,也就会提供参数来控制行为,你的目标就是把它
    改成 1。
    2. 确认是否有不必要的只读事务。有些框架会习惯不管什么语句先用 begin/commit 框起
    来。我见过有些是业务并没有这个需要,但是也把好几个 select 语句放到了事务中。这
    种只读事务可以去掉。
    3. 业务连接数据库的时候,根据业务本身的预估,通过 SET MAX_EXECUTION_TIME 命
    令,来控制每个语句执行的最长时间,避免单个语句意外执行太长时间。(为什么会意
    外?在后续的文章中会提到这类案例)

    其次,从数据库端来看:

  2. 监控 information_schema.Innodb_trx 表,设置长事务阈值,超过就报警 / 或者 kill;
    2. Percona 的 pt-kill 这个工具不错,推荐使用;
    3. 在业务功能测试阶段要求输出所有的 general_log,分析日志行为提前发现问题;
    4. 如果使用的是 MySQL 5.6 或者更新版本,把 innodb_undo_tablespaces 设置成 2(或
    更大的值)。如果真的出现大事务导致回滚段过大,这样设置后清理起来更方便。

索引

InnoDB 的索引模型
在 InnoDB 中,表都是根据主键顺序以索引的形式存放的,这种存储方式的表称为索引组
织表。又因为前面我们提到的,InnoDB 使用了 B+ 树索引模型,所以数据都是存储在 B+
树中的。每一个索引在 InnoDB 里面对应一棵 B+ 树。
假设,我们有一个主键列为 ID 的表,表中有字段 k,并且在 k 上有索引。
这个表的建表语句是:

  1. 1 mysql> create table T(
  2. 2 id int primary key,
  3. 3 k int not null,
  4. 4 name varchar(16),
  5. 5 index (k))engine=InnoDB;

表中 R1~R5 的 (ID,k) 值分别为 (100,1)、(200,2)、(300,3)、(500,5) 和 (600,6),两棵树
的示例示意图如下。
image.png
图 4 InnoDB 的索引组织结构从图中不难看出,根据叶子节点的内容,索引类型分为主键索引和非主键索引。
主键索引的叶子节点存的是整行数据。在 InnoDB 里,主键索引也被称为聚簇索引
(clustered index)。
非主键索引的叶子节点内容是主键的值。在 InnoDB 里,非主键索引也被称为二级索引
(secondary index)。
根据上面的索引结构说明,我们来讨论一个问题:基于主键索引和普通索引的查询有什么区
别?
如果语句是 select from T where ID=500,即主键查询方式,则只需要搜索 ID 这棵
B+ 树;
如果语句是 select
from T where k=5,即普通索引查询方式,则需要先搜索 k 索引
树,得到 ID 的值为 500,再到 ID 索引树搜索一次。这个过程称为回表。
也就是说,基于非主键索引的查询需要多扫描一棵索引树。因此,我们在应用中应该尽量使
用主键查询。

索引维护

B+ 树为了维护索引有序性,在插入新值的时候需要做必要的维护。以上面这个图为例,如
果插入新的行 ID 值为 700,则只需要在 R5 的记录后面插入一个新记录。如果新插入的 ID
值为 400,就相对麻烦了,需要逻辑上挪动后面的数据,空出位置。
而更糟的情况是,如果 R5 所在的数据页已经满了,根据 B+ 树的算法,这时候需要申请一
个新的数据页,然后挪动部分数据过去。这个过程称为页分裂。在这种情况下,性能自然会
受影响。
除了性能外,页分裂操作还影响数据页的利用率。原本放在一个页的数据,现在分到两个页
中,整体空间利用率降低大约 50%。
当然有分裂就有合并。当相邻两个页由于删除了数据,利用率很低之后,会将数据页做合
并。合并的过程,可以认为是分裂过程的逆过程。基于上面的索引维护过程说明,我们来讨论一个案例:
你可能在一些建表规范里面见到过类似的描述,要求建表语句里一定要有自
增主键。当然事无绝对,我们来分析一下哪些场景下应该使用自增主键,而
哪些场景下不应该。
自增主键是指自增列上定义的主键,在建表语句中一般是这么定义的: NOT NULL
PRIMARY KEY AUTO_INCREMENT。
插入新记录的时候可以不指定 ID 的值,系统会获取当前 ID 最大值加 1 作为下一条记录的
ID 值。
也就是说,自增主键的插入数据模式,正符合了我们前面提到的递增插入的场景。每次插入
一条新记录,都是追加操作,都不涉及到挪动其他记录,也不会触发叶子节点的分裂。
而有业务逻辑的字段做主键,则往往不容易保证有序插入,这样写数据成本相对较高。
除了考虑性能外,我们还可以从存储空间的角度来看。假设你的表中确实有一个唯一字段,
比如字符串类型的身份证号,那应该用身份证号做主键,还是用自增字段做主键呢?
由于每个非主键索引的叶子节点上都是主键的值。如果用身份证号做主键,那么每个二级索
引的叶子节点占用约 20 个字节,而如果用整型做主键,则只要 4 个字节,如果是长整型
(bigint)则是 8 个字节。

显然,主键长度越小,普通索引的叶子节点就越小,普通索引占用的空间也就越小。
所以,从性能和存储空间方面考量,自增主键往往是更合理的选择。
有没有什么场景适合用业务字段直接做主键的呢?还是有的。比如,有些业务的场景需求是
这样的:

  1. 只有一个索引;
    2. 该索引必须是唯一索引。
    你一定看出来了,这就是典型的 KV 场景。由于没有其他索引,所以也就不用考虑其他索引的叶子节点大小的问题。
    这时候我们就要优先考虑上一段提到的“尽量使用主键查询”原则,直接将这个索引设置为
    主键,可以避免每次查询需要搜索两棵树。
    小结
    今天,我跟你分析了数据库引擎可用的数据结构,介绍了 InnoDB 采用的 B+ 树结构,以
    及为什么 InnoDB 要这么选择。B+ 树能够很好地配合磁盘的读写特性,减少单次查询的磁
    盘访问次数。
    由于 InnoDB 是索引组织表,一般情况下我会建议你创建一个自增主键,这样非主键索引
    占用的空间最小。但事无绝对,我也跟你讨论了使用业务逻辑字段做主键的应用场景。
    最后,我给你留下一个问题吧。对于上面例子中的 InnoDB 表 T,如果你要重建索引 k,你
    的两个 SQL 语句可以这么写:
     复制代码
    1 alter table T drop index k;
    2 alter table T add index(k);
    如果你要重建主键索引,也可以这么写:
     复制代码
    1 alter table T drop primary key;
    2 alter table T add primary key(id);
    我的问题是,对于上面这两个重建索引的作法,说出你的理解。如果有不合适的,为什么,
    更好的方法是什么?
    你可以把你的思考和观点写在留言区里,我会在下一篇文章的末尾给出我的参考答案。感谢
    你的收听,也欢迎你把这篇文章分享给更多的朋友一起阅读。

上期的问题是,通过两个 alter 语句重建索引 k,以及通过两个 alter 语句重建主键索引是
否合理。
在评论区,有同学问到为什么要重建索引。我们文章里面有提到,索引可能因为删除,或者
页分裂等原因,导致数据页有空洞,重建索引的过程会创建一个新的索引,把数据按顺序插
入,这样页面的利用率最高,也就是索引更紧凑、更省空间。
这道题目,我给你的“参考答案”是:
重建索引 k 的做法是合理的,可以达到省空间的目的。但是,重建主键的过程不合理。不
论是删除主键还是创建主键,都会将整个表重建。所以连着执行这两个语句的话,第一个语
句就白做了。这两个语句,你可以用这个语句代替 : alter table T engine=InnoDB。
专栏的第 12 篇文章《为什么表数据删掉一半,表文件大小不变?》中,我会和你分析这条
语句的执行流程。

MYSQL的sql语句集合

场景操作

  1. /**展示和使用mysql有哪些可以使用的引擎、

你可以在 information_schema 库的 innodb_trx 这个表中查询长事务,比如下面这个语句,用于查找持续时间超过 60s 的事务。

  1. select * from information_schema.innodb_trx where TIME_TO_SEC(timediff(now(),trx_started)) > 60

基本操作

/ Windows服务 /
— 启动MySQL
net start mysql
— 创建Windows服务
sc create mysql binPath= mysqld_bin_path(注意:等号与值之间有空格)
/ 连接与断开服务器 /
mysql -h 地址 -P 端口 -u 用户名 -p 密码
SHOW PROCESSLIST — 显示哪些线程正在运行
SHOW VARIABLES — 显示系统变量信息

数据库操作

/ 数据库操作 / —————————
— 查看当前数据库
SELECT DATABASE();
— 显示当前时间、用户名、数据库版本
SELECT now(), user(), version();
— 创建库
CREATE DATABASE[ IF NOT EXISTS] 数据库名 数据库选项
数据库选项:
CHARACTER SET charset_name
COLLATE collation_name
— 查看已有库
SHOW DATABASES[ LIKE ‘PATTERN’]
— 查看当前库信息
SHOW CREATE DATABASE 数据库名
— 修改库的选项信息
ALTER DATABASE 库名 选项信息
— 删除库
DROP DATABASE[ IF EXISTS] 数据库名
同时删除该数据库相关的目录及其目录内容

表的操作

— 创建表
CREATE [TEMPORARY] TABLE[ IF NOT EXISTS] [库名.]表名 ( 表的结构定义 )[ 表选项]
每个字段必须有数据类型
最后一个字段后不能有逗号
TEMPORARY 临时表,会话结束时表自动消失
对于字段的定义:
字段名 数据类型 [NOT NULL | NULL] [DEFAULT default_value] [AUTO_INCREMENT] [UNIQUE [KEY] | [PRIMARY] KEY] [COMMENT ‘string’]
— 表选项
— 字符集
CHARSET = charset_name
如果表没有设定,则使用数据库字符集
— 存储引擎
ENGINE = engine_name
表在管理数据时采用的不同的数据结构,结构不同会导致处理方式、提供的特性操作等不同
常见的引擎:InnoDB MyISAM Memory/Heap BDB Merge Example CSV MaxDB Archive
不同的引擎在保存表的结构和数据时采用不同的方式
MyISAM表文件含义:.frm表定义,.MYD表数据,.MYI表索引
InnoDB表文件含义:.frm表定义,表空间数据和日志文件
SHOW ENGINES — 显示存储引擎的状态信息
SHOW ENGINE 引擎名 {LOGS|STATUS} — 显示存储引擎的日志或状态信息
— 自增起始数
AUTO_INCREMENT = 行数
— 数据文件目录
DATA DIRECTORY = ‘目录’
— 索引文件目录
INDEX DIRECTORY = ‘目录’
— 表注释
COMMENT = ‘string’
— 分区选项
PARTITION BY … (详细见手册)
— 查看所有表
SHOW TABLES[ LIKE ‘pattern’]
SHOW TABLES FROM 库名
— 查看表结构
SHOW CREATE TABLE 表名 (信息更详细)
DESC 表名 / DESCRIBE 表名 / EXPLAIN 表名 / SHOW COLUMNS FROM 表名 [LIKE ‘PATTERN’]
SHOW TABLE STATUS [FROM db_name] [LIKE ‘pattern’]
— 修改表
— 修改表本身的选项
ALTER TABLE 表名 表的选项
eg: ALTER TABLE 表名 ENGINE=MYISAM;
— 对表进行重命名
RENAME TABLE 原表名 TO 新表名
RENAME TABLE 原表名 TO 库名.表名 (可将表移动到另一个数据库)
— RENAME可以交换两个表名
— 修改表的字段机构(13.1.2. ALTER TABLE语法)
ALTER TABLE 表名 操作名
— 操作名
ADD[ COLUMN] 字段定义 — 增加字段
AFTER 字段名 — 表示增加在该字段名后面
FIRST — 表示增加在第一个
ADD PRIMARY KEY(字段名) — 创建主键
ADD UNIQUE [索引名] (字段名)— 创建唯一索引
ADD INDEX [索引名] (字段名) — 创建普通索引
DROP[ COLUMN] 字段名 — 删除字段
MODIFY[ COLUMN] 字段名 字段属性 — 支持对字段属性进行修改,不能修改字段名(所有原有属性也需写上)
CHANGE[ COLUMN] 原字段名 新字段名 字段属性 — 支持对字段名修改
DROP PRIMARY KEY — 删除主键(删除主键前需删除其AUTO_INCREMENT属性)
DROP INDEX 索引名 — 删除索引
DROP FOREIGN KEY 外键 — 删除外键
— 删除表
DROP TABLE[ IF EXISTS] 表名 …
— 清空表数据
TRUNCATE [TABLE] 表名
— 复制表结构
CREATE TABLE 表名 LIKE 要复制的表名
— 复制表结构和数据
CREATE TABLE 表名 [AS] SELECT * FROM 要复制的表名
— 检查表是否有错误
CHECK TABLE tbl_name [, tbl_name] … [option] …
— 优化表
OPTIMIZE [LOCAL | NO_WRITE_TO_BINLOG] TABLE tbl_name [, tbl_name] …
— 修复表
REPAIR [LOCAL | NO_WRITE_TO_BINLOG] TABLE tbl_name [, tbl_name] … [QUICK] [EXTENDED] [USE_FRM]
— 分析表
ANALYZE [LOCAL | NO_WRITE_TO_BINLOG] TABLE tbl_name [, tbl_name] …

数据操作

/ 数据操作 / —————————
— 增
INSERT [INTO] 表名 [(字段列表)] VALUES (值列表)[, (值列表), …]
— 如果要插入的值列表包含所有字段并且顺序一致,则可以省略字段列表。
— 可同时插入多条数据记录!
REPLACE 与 INSERT 完全一样,可互换。
INSERT [INTO] 表名 SET 字段名=值[, 字段名=值, …]
— 查
SELECT 字段列表 FROM 表名[ 其他子句]
— 可来自多个表的多个字段
— 其他子句可以不使用
— 字段列表可以用*代替,表示所有字段
— 删
DELETE FROM 表名[ 删除条件子句]
没有条件子句,则会删除全部
— 改
UPDATE 表名 SET 字段名=新值[, 字段名=新值] [更新条件]

字符集编码

/ 字符集编码 / —————————
— MySQL、数据库、表、字段均可设置编码
— 数据编码与客户端编码不需一致
SHOW VARIABLES LIKE ‘characterset%’ — 查看所有字符集编码项
character_set_client 客户端向服务器发送数据时使用的编码
character_set_results 服务器端将结果返回给客户端所使用的编码
character_set_connection 连接层编码
SET 变量名 = 变量值
SET character_set_client = gbk;
SET character_set_results = gbk;
SET character_set_connection = gbk;
SET NAMES GBK; — 相当于完成以上三个设置
— 校对集
校对集用以排序
SHOW CHARACTER SET [LIKE ‘pattern’]/SHOW CHARSET [LIKE ‘pattern’] 查看所有字符集
SHOW COLLATION [LIKE ‘pattern’] 查看所有校对集
CHARSET 字符集编码 设置字符集编码
COLLATE 校对集编码 设置校对集编码

数据类型(列类型)

/ 数据类型(列类型) / —————————
1. 数值类型
— a. 整型 —————
类型 字节 范围(有符号位)
tinyint 1字节 -128 ~ 127 无符号位:0 ~ 255
smallint 2字节 -32768 ~ 32767
mediumint 3字节 -8388608 ~ 8388607
int 4字节
bigint 8字节
int(M) M表示总位数
- 默认存在符号位,unsigned 属性修改
- 显示宽度,如果某个数不够定义字段时设置的位数,则前面以0补填,zerofill 属性修改
例:int(5) 插入一个数’123’,补填后为’00123’
- 在满足要求的情况下,越小越好。
- 1表示bool值真,0表示bool值假。MySQL没有布尔类型,通过整型0和1表示。常用tinyint(1)表示布尔型。
— b. 浮点型 —————
类型 字节 范围
float(单精度) 4字节
double(双精度) 8字节
浮点型既支持符号位 unsigned 属性,也支持显示宽度 zerofill 属性。
不同于整型,前后均会补填0.
定义浮点型时,需指定总位数和小数位数。
float(M, D) double(M, D)
M表示总位数,D表示小数位数。
M和D的大小会决定浮点数的范围。不同于整型的固定范围。
M既表示总位数(不包括小数点和正负号),也表示显示宽度(所有显示符号均包括)。
支持科学计数法表示。
浮点数表示近似值。
— c. 定点数 —————
decimal — 可变长度
decimal(M, D) M也表示总位数,D表示小数位数。
保存一个精确的数值,不会发生数据的改变,不同于浮点数的四舍五入。
将浮点数转换为字符串来保存,每9位数字保存为4个字节。
2. 字符串类型
— a. char, varchar —————
char 定长字符串,速度快,但浪费空间
varchar 变长字符串,速度慢,但节省空间
M表示能存储的最大长度,此长度是字符数,非字节数。
不同的编码,所占用的空间不同。
char,最多255个字符,与编码无关。
varchar,最多65535字符,与编码有关。
一条有效记录最大不能超过65535个字节。
utf8 最大为21844个字符,gbk 最大为32766个字符,latin1 最大为65532个字符
varchar 是变长的,需要利用存储空间保存 varchar 的长度,如果数据小于255个字节,则采用一个字节来保存长度,反之需要两个字节来保存。
varchar 的最大有效长度由最大行大小和使用的字符集确定。
最大有效长度是65532字节,因为在varchar存字符串时,第一个字节是空的,不存在任何数据,然后还需两个字节来存放字符串的长度,所以有效长度是65535-1-2=65532字节。
例:若一个表定义为 CREATE TABLE tb(c1 int, c2 char(30), c3 varchar(N)) charset=utf8; 问N的最大值是多少? 答:(65535-1-2-4-30*3)/3
— b. blob, text —————
blob 二进制字符串(字节字符串)
tinyblob, blob, mediumblob, longblob
text 非二进制字符串(字符字符串)
tinytext, text, mediumtext, longtext
text 在定义时,不需要定义长度,也不会计算总长度。
text 类型在定义时,不可给default值
— c. binary, varbinary —————
类似于char和varchar,用于保存二进制字符串,也就是保存字节字符串而非字符字符串。
char, varchar, text 对应 binary, varbinary, blob.
3. 日期时间类型
一般用整型保存时间戳,因为PHP可以很方便的将时间戳进行格式化。
datetime 8字节 日期及时间 1000-01-01 00:00:00 到 9999-12-31 23:59:59
date 3字节 日期 1000-01-01 到 9999-12-31
timestamp 4字节 时间戳 19700101000000 到 2038-01-19 03:14:07
time 3字节 时间 -838:59:59 到 838:59:59
year 1字节 年份 1901 - 2155
datetime YYYY-MM-DD hh:mm:ss
timestamp YY-MM-DD hh:mm:ss
YYYYMMDDhhmmss
YYMMDDhhmmss
YYYYMMDDhhmmss
YYMMDDhhmmss
date YYYY-MM-DD
YY-MM-DD
YYYYMMDD
YYMMDD
YYYYMMDD
YYMMDD
time hh:mm:ss
hhmmss
hhmmss
year YYYY
YY
YYYY
YY
4. 枚举和集合
— 枚举(enum) —————
enum(val1, val2, val3…)
在已知的值中进行单选。最大数量为65535.
枚举值在保存时,以2个字节的整型(smallint)保存。每个枚举值,按保存的位置顺序,从1开始逐一递增。
表现为字符串类型,存储却是整型。
NULL值的索引是NULL。
空字符串错误值的索引值是0。
— 集合(set) —————
set(val1, val2, val3…)
create table tab ( gender set(‘男’, ‘女’, ‘无’) );
insert into tab values (‘男, 女’);
最多可以有64个不同的成员。以bigint存储,共8个字节。采取位运算的形式。
当创建表时,SET成员值的尾部空格将自动被删除。

列属性(列约束)

/ 列属性(列约束) / —————————
1. PRIMARY 主键
- 能唯一标识记录的字段,可以作为主键。
- 一个表只能有一个主键。
- 主键具有唯一性。
- 声明字段时,用 primary key 标识。
也可以在字段列表之后声明
例:create table tab ( id int, stu varchar(10), primary key (id));
- 主键字段的值不能为null。
- 主键可以由多个字段共同组成。此时需要在字段列表后声明的方法。
例:create table tab ( id int, stu varchar(10), age int, primary key (stu, age));
2. UNIQUE 唯一索引(唯一约束)
使得某字段的值也不能重复。
3. NULL 约束
null不是数据类型,是列的一个属性。
表示当前列是否可以为null,表示什么都没有。
null, 允许为空。默认。
not null, 不允许为空。
insert into tab values (null, ‘val’);
— 此时表示将第一个字段的值设为null, 取决于该字段是否允许为null
4. DEFAULT 默认值属性
当前字段的默认值。
insert into tab values (default, ‘val’); — 此时表示强制使用默认值。
create table tab ( add_time timestamp default current_timestamp );
— 表示将当前时间的时间戳设为默认值。
current_date, current_time
5. AUTO_INCREMENT 自动增长约束
自动增长必须为索引(主键或unique)
只能存在一个字段为自动增长。
默认为1开始自动增长。可以通过表属性 auto_increment = x进行设置,或 alter table tbl auto_increment = x;
6. COMMENT 注释
例:create table tab ( id int ) comment ‘注释内容’;
7. FOREIGN KEY 外键约束
用于限制主表与从表数据完整性。
alter table t1 add constraint t1_t2_fk foreign key (t1_id) references t2(id);
— 将表t1的t1_id外键关联到表t2的id字段。
— 每个外键都有一个名字,可以通过 constraint 指定
存在外键的表,称之为从表(子表),外键指向的表,称之为主表(父表)。
作用:保持数据一致性,完整性,主要目的是控制存储在外键表(从表)中的数据。
MySQL中,可以对InnoDB引擎使用外键约束:
语法:
foreign key (外键字段) references 主表名 (关联字段) [主表记录删除时的动作] [主表记录更新时的动作]
此时需要检测一个从表的外键需要约束为主表的已存在的值。外键在没有关联的情况下,可以设置为null.前提是该外键列,没有not null。
可以不指定主表记录更改或更新时的动作,那么此时主表的操作被拒绝。
如果指定了 on update 或 on delete:在删除或更新时,有如下几个操作可以选择:
1. cascade,级联操作。主表数据被更新(主键值更新),从表也被更新(外键值更新)。主表记录被删除,从表相关记录也被删除。
2. set null,设置为null。主表数据被更新(主键值更新),从表的外键被设置为null。主表记录被删除,从表相关记录外键被设置成null。但注意,要求该外键列,没有not null属性约束。
3. restrict,拒绝父表删除和更新。
注意,外键只被InnoDB存储引擎所支持。其他引擎是不支持的。

建表规范

/ 建表规范 / —————————
— Normal Format, NF
- 每个表保存一个实体信息
- 每个具有一个ID字段作为主键
- ID主键 + 原子表
— 1NF, 第一范式
字段不能再分,就满足第一范式。
— 2NF, 第二范式
满足第一范式的前提下,不能出现部分依赖。
消除复合主键就可以避免部分依赖。增加单列关键字。
— 3NF, 第三范式
满足第二范式的前提下,不能出现传递依赖。
某个字段依赖于主键,而有其他字段依赖于该字段。这就是传递依赖。
将一个实体信息的数据放在一个表内实现。

SELECT

/ SELECT / —————————
SELECT [ALL|DISTINCT] select_expr FROM -> WHERE -> GROUP BY [合计函数] -> HAVING -> ORDER BY -> LIMIT
a. select_expr
— 可以用 表示所有字段。
select
from tb;
— 可以使用表达式(计算公式、函数调用、字段也是个表达式)
select stu, 29+25, now() from tb;
— 可以为每个列使用别名。适用于简化列标识,避免多个列标识符重复。
- 使用 as 关键字,也可省略 as.
select stu+10 as add10 from tb;
b. FROM 子句
用于标识查询来源。
— 可以为表起别名。使用as关键字。
SELECT FROM tb1 AS tt, tb2 AS bb;
— from子句后,可以同时出现多个表。
— 多个表会横向叠加到一起,而数据会形成一个笛卡尔积。
SELECT
FROM tb1, tb2;
— 向优化符提示如何选择索引
USE INDEX、IGNORE INDEX、FORCE INDEX
SELECT FROM table1 USE INDEX (key1,key2) WHERE key1=1 AND key2=2 AND key3=3;
SELECT
FROM table1 IGNORE INDEX (key3) WHERE key1=1 AND key2=2 AND key3=3;
c. WHERE 子句
— 从from获得的数据源中进行筛选。
— 整型1表示真,0表示假。
— 表达式由运算符和运算数组成。
— 运算数:变量(字段)、值、函数返回值
— 运算符:
=, <=>, <>, !=, <=, <, >=, >, !, &&, ||,
in (not) null, (not) like, (not) in, (not) between and, is (not), and, or, not, xor
is/is not 加上ture/false/unknown,检验某个值的真假
<=>与<>功能相同,<=>可用于null比较
d. GROUP BY 子句, 分组子句
GROUP BY 字段/别名 [排序方式]
分组后会进行排序。升序:ASC,降序:DESC
以下[合计函数]需配合 GROUP BY 使用:
count 返回不同的非NULL值数目 count(*)、count(字段)
sum 求和
max 求最大值
min 求最小值
avg 求平均值
group_concat 返回带有来自一个组的连接的非NULL值的字符串结果。组内字符串连接。
e. HAVING 子句,条件子句
与 where 功能、用法相同,执行时机不同。
where 在开始时执行检测数据,对原数据进行过滤。
having 对筛选出的结果再次进行过滤。
having 字段必须是查询出来的,where 字段必须是数据表存在的。
where 不可以使用字段的别名,having 可以。因为执行WHERE代码时,可能尚未确定列值。
where 不可以使用合计函数。一般需用合计函数才会用 having
SQL标准要求HAVING必须引用GROUP BY子句中的列或用于合计函数中的列。
f. ORDER BY 子句,排序子句
order by 排序字段/别名 排序方式 [,排序字段/别名 排序方式]…
升序:ASC,降序:DESC
支持多个字段的排序。
g. LIMIT 子句,限制结果数量子句
仅对处理好的结果进行数量限制。将处理好的结果的看作是一个集合,按照记录出现的顺序,索引从0开始。
limit 起始位置, 获取条数
省略第一个参数,表示从索引0开始。limit 获取条数
h. DISTINCT, ALL 选项
distinct 去除重复记录
默认为 all, 全部记录

UNION

/ UNION / —————————
将多个select查询的结果组合成一个结果集合。
SELECT … UNION [ALL|DISTINCT] SELECT …
默认 DISTINCT 方式,即所有返回的行都是唯一的
建议,对每个SELECT查询加上小括号包裹。
ORDER BY 排序时,需加上 LIMIT 进行结合。
需要各select查询的字段数量一样。
每个select查询的字段列表(数量、类型)应一致,因为结果中的字段名以第一条select语句为准。

子查询

/ 子查询 / —————————
- 子查询需用括号包裹。
— from型
from后要求是一个表,必须给子查询结果取个别名。
- 简化每个查询内的条件。
- from型需将结果生成一个临时表格,可用以原表的锁定的释放。
- 子查询返回一个表,表型子查询。
select from (select from tb where id>0) as subfrom where id>1;
— where型
- 子查询返回一个值,标量子查询。
- 不需要给子查询取别名。
- where子查询内的表,不能直接用以更新。
select from tb where money = (select max(money) from tb);
— 列子查询
如果子查询结果返回的是一列。
使用 in 或 not in 完成查询
exists 和 not exists 条件
如果子查询返回数据,则返回1或0。常用于判断条件。
select column1 from t1 where exists (select
from t2);
— 行子查询
查询条件是一个行。
select * from t1 where (id, gender) in (select id, gender from t2);
行构造符:(col1, col2, …) 或 ROW(col1, col2, …)
行构造符通常用于与对能返回两个或两个以上列的子查询进行比较。
— 特殊运算符
!= all() 相当于 not in
= some() 相当于 in。any 是 some 的别名
!= some() 不等同于 not in,不等于其中某一个。
all, some 可以配合其他运算符一起使用。

连接查询(join)

/ 连接查询(join) / —————————
将多个表的字段进行连接,可以指定连接条件。
— 内连接(inner join)
- 默认就是内连接,可省略inner。
- 只有数据存在时才能发送连接。即连接结果不能出现空行。
on 表示连接条件。其条件表达式与where类似。也可以省略条件(表示条件永远为真)
也可用where表示连接条件。
还有 using, 但需字段名相同。 using(字段名)
— 交叉连接 cross join
即,没有条件的内连接。
select * from tb1 cross join tb2;
— 外连接(outer join)
- 如果数据不存在,也会出现在连接结果中。
— 左外连接 left join
如果数据不存在,左表记录会出现,而右表为null填充
— 右外连接 right join
如果数据不存在,右表记录会出现,而左表为null填充
— 自然连接(natural join)
自动判断连接条件完成连接。
相当于省略了using,会自动查找相同字段名。
natural join
natural left join
natural right join
select info.id, info.name, info.stu_num, extra_info.hobby, extra_info.sex from info, extra_info where info.stu_num = extra_info.stu_id;

TRUNCATE

/ TRUNCATE / —————————
TRUNCATE [TABLE] tbl_name
清空数据
删除重建表
区别:
1,truncate 是删除表再创建,delete 是逐条删除
2,truncate 重置auto_increment的值。而delete不会
3,truncate 不知道删除了几条,而delete知道。
4,当被用于带分区的表时,truncate 会保留分区

备份与还原

/ 备份与还原 / —————————
备份,将数据的结构与表内数据保存起来。
利用 mysqldump 指令完成。
— 导出
mysqldump [options] db_name [tables]
mysqldump [options] —-database DB1 [DB2 DB3…]
mysqldump [options] —all—database
1. 导出一张表
 mysqldump -u用户名 -p密码 库名 表名 > 文件名(D:/a.sql)
2. 导出多张表
 mysqldump -u用户名 -p密码 库名 表1 表2 表3 > 文件名(D:/a.sql)
3. 导出所有表
 mysqldump -u用户名 -p密码 库名 > 文件名(D:/a.sql)
4. 导出一个库
 mysqldump -u用户名 -p密码 —lock-all-tables —database 库名 > 文件名(D:/a.sql)
可以-w携带WHERE条件
— 导入
1. 在登录mysql的情况下:
 source 备份文件
2. 在不登录的情况下
 mysql -u用户名 -p密码 库名 < 备份文件

视图

什么是视图:
视图是一个虚拟表,其内容由查询定义。同真实的表一样,视图包含一系列带有名称的列和行数据。但是,视图并不在数据库中以存储的数据值集形式存在。行和列数据来自由定义视图的查询所引用的表,并且在引用视图时动态生成。
视图具有表结构文件,但不存在数据文件。
对其中所引用的基础表来说,视图的作用类似于筛选。定义视图的筛选可以来自当前或其它数据库的一个或多个表,或者其它视图。通过视图进行查询没有任何限制,通过它们进行数据修改时的限制也很少。
视图是存储在数据库中的查询的sql语句,它主要出于两种原因:安全原因,视图可以隐藏一些数据,如:社会保险基金表,可以用视图只显示姓名,地址,而不显示社会保险号和工资数等,另一原因是可使复杂的查询易于理解和使用。
— 创建视图
CREATE [OR REPLACE] [ALGORITHM = {UNDEFINED | MERGE | TEMPTABLE}] VIEW view_name [(column_list)] AS select_statement
- 视图名必须唯一,同时不能与表重名。
- 视图可以使用select语句查询到的列名,也可以自己指定相应的列名。
- 可以指定视图执行的算法,通过ALGORITHM指定。
- column_list如果存在,则数目必须等于SELECT语句检索的列数
— 查看结构
SHOW CREATE VIEW view_name
— 删除视图
- 删除视图后,数据依然存在。
- 可同时删除多个视图。
DROP VIEW [IF EXISTS] view_name …
— 修改视图结构
- 一般不修改视图,因为不是所有的更新视图都会映射到表上。
ALTER VIEW view_name [(column_list)] AS select_statement
— 视图作用
1. 简化业务逻辑
2. 对客户端隐藏真实的表结构
— 视图算法(ALGORITHM)
MERGE 合并
将视图的查询语句,与外部查询需要先合并再执行!
TEMPTABLE 临时表
将视图执行完毕后,形成临时表,再做外层查询!
UNDEFINED 未定义(默认),指的是MySQL自主去选择相应的算法。

事务(transaction)

事务是指逻辑上的一组操作,组成这组操作的各个单元,要不全成功要不全失败。
- 支持连续SQL的集体成功或集体撤销。
- 事务是数据库在数据完整性方面的一个功能。
- 需要利用 InnoDB 或 BDB 存储引擎,对自动提交的特性支持完成。
- InnoDB被称为事务安全型引擎。
— 事务开启
START TRANSACTION; 或者 BEGIN;
开启事务后,所有被执行的SQL语句均被认作当前事务内的SQL语句。
— 事务提交
COMMIT;
— 事务回滚
ROLLBACK;
如果部分操作发生问题,映射到事务开启前。
— 事务的特性
1. 原子性(Atomicity)
事务是一个不可分割的工作单位,事务中的操作要么都发生,要么都不发生。
2. 一致性(Consistency)
事务前后数据的完整性必须保持一致。
- 事务开始和结束时,外部数据一致
- 在整个事务过程中,操作是连续的
3. 隔离性(Isolation)
多个用户并发访问数据库时,一个用户的事务不能被其它用户的事物所干扰,多个并发事务之间的数据要相互隔离。
4. 持久性(Durability)
一个事务一旦被提交,它对数据库中的数据改变就是永久性的。
— 事务的实现
1. 要求是事务支持的表类型
2. 执行一组相关的操作前开启事务
3. 整组操作完成后,都成功,则提交;如果存在失败,选择回滚,则会回到事务开始的备份点。
— 事务的原理
利用InnoDB的自动提交(autocommit)特性完成。
普通的MySQL执行语句后,当前的数据提交操作均可被其他客户端可见。
而事务是暂时关闭“自动提交”机制,需要commit提交持久化数据操作。
— 注意
1. 数据定义语言(DDL)语句不能被回滚,比如创建或取消数据库的语句,和创建、取消或更改表或存储的子程序的语句。
2. 事务不能被嵌套
— 保存点
SAVEPOINT 保存点名称 — 设置一个事务保存点
ROLLBACK TO SAVEPOINT 保存点名称 — 回滚到保存点
RELEASE SAVEPOINT 保存点名称 — 删除保存点
— InnoDB自动提交特性设置
SET autocommit = 0|1; 0表示关闭自动提交,1表示开启自动提交。
- 如果关闭了,那普通操作的结果对其他客户端也不可见,需要commit提交后才能持久化数据操作。
- 也可以关闭自动提交来开启事务。但与START TRANSACTION不同的是,
SET autocommit是永久改变服务器的设置,直到下次再次修改该设置。(针对当前连接)
而START TRANSACTION记录开启前的状态,而一旦事务提交或回滚后就需要再次开启事务。(针对当前事务)

锁表

/ 锁表 /
表锁定只用于防止其它客户端进行不正当地读取和写入
MyISAM 支持表锁,InnoDB 支持行锁
— 锁定
LOCK TABLES tbl_name [AS alias]
— 解锁
UNLOCK TABLES

触发器

/ 触发器 / —————————
触发程序是与表有关的命名数据库对象,当该表出现特定事件时,将激活该对象
监听:记录的增加、修改、删除。
— 创建触发器
CREATE TRIGGER trigger_name trigger_time trigger_event ON tbl_name FOR EACH ROW trigger_stmt
参数:
trigger_time是触发程序的动作时间。它可以是 before 或 after,以指明触发程序是在激活它的语句之前或之后触发。
trigger_event指明了激活触发程序的语句的类型
INSERT:将新行插入表时激活触发程序
UPDATE:更改某一行时激活触发程序
DELETE:从表中删除某一行时激活触发程序
tbl_name:监听的表,必须是永久性的表,不能将触发程序与TEMPORARY表或视图关联起来。
trigger_stmt:当触发程序激活时执行的语句。执行多个语句,可使用BEGIN…END复合语句结构
— 删除
DROP TRIGGER [schema_name.]trigger_name
可以使用old和new代替旧的和新的数据
更新操作,更新前是old,更新后是new.
删除操作,只有old.
增加操作,只有new.
— 注意
1. 对于具有相同触发程序动作时间和事件的给定表,不能有两个触发程序。
— 字符连接函数
concat(str1,str2,…])
concat_ws(separator,str1,str2,…)
— 分支语句
if 条件 then
执行语句
elseif 条件 then
执行语句
else
执行语句
end if;
— 修改最外层语句结束符
delimiter 自定义结束符号
SQL语句
自定义结束符号
delimiter ; — 修改回原来的分号
— 语句块包裹
begin
语句块
end
— 特殊的执行
1. 只要添加记录,就会触发程序。
2. Insert into on duplicate key update 语法会触发:
如果没有重复记录,会触发 before insert, after insert;
如果有重复记录并更新,会触发 before insert, before update, after update;
如果有重复记录但是没有发生更新,则触发 before insert, before update
3. Replace 语法 如果有记录,则执行 before insert, before delete, after delete, after insert

SQL编程

/ SQL编程 / —————————
—// 局部变量 —————
— 变量声明
declare var_name[,…] type [default value]
这个语句被用来声明局部变量。要给变量提供一个默认值,请包含一个default子句。值可以被指定为一个表达式,不需要为一个常数。如果没有default子句,初始值为null。
— 赋值
使用 set 和 select into 语句为变量赋值。
- 注意:在函数内是可以使用全局变量(用户自定义的变量)
—// 全局变量 —————
— 定义、赋值
set 语句可以定义并为变量赋值。
set @var = value;
也可以使用select into语句为变量初始化并赋值。这样要求select语句只能返回一行,但是可以是多个字段,就意味着同时为多个变量进行赋值,变量的数量需要与查询的列数一致。
还可以把赋值语句看作一个表达式,通过select执行完成。此时为了避免=被当作关系运算符看待,使用:=代替。(set语句可以使用= 和 :=)。
select @var:=20;
select @v1:=id, @v2=name from t1 limit 1;
select * from tbl_name where @var:=30;
select into 可以将表中查询获得的数据赋给变量。
-| select max(height) into @max_height from tb;
— 自定义变量名
为了避免select语句中,用户自定义的变量与系统标识符(通常是字段名)冲突,用户自定义变量在变量名前使用@作为开始符号。
@var=10;
- 变量被定义后,在整个会话周期都有效(登录到退出)
—// 控制结构 —————
— if语句
if search_condition then
statement_list
[elseif search_condition then
statement_list]

[else
statement_list]
end if;
— case语句
CASE value WHEN [compare-value] THEN result
[WHEN [compare-value] THEN result …]
[ELSE result]
END
— while循环
[begin_label:] while search_condition do
statement_list
end while [end_label];
- 如果需要在循环内提前终止 while循环,则需要使用标签;标签需要成对出现。
— 退出循环
退出整个循环 leave
退出当前循环 iterate
通过退出的标签决定退出哪个循环
—// 内置函数 —————
— 数值函数
abs(x) — 绝对值 abs(-10.9) = 10
format(x, d) — 格式化千分位数值 format(1234567.456, 2) = 1,234,567.46
ceil(x) — 向上取整 ceil(10.1) = 11
floor(x) — 向下取整 floor (10.1) = 10
round(x) — 四舍五入去整
mod(m, n) — m%n m mod n 求余 10%3=1
pi() — 获得圆周率
pow(m, n) — m^n
sqrt(x) — 算术平方根
rand() — 随机数
truncate(x, d) — 截取d位小数
— 时间日期函数
now(), current_timestamp(); — 当前日期时间
current_date(); — 当前日期
current_time(); — 当前时间
date(‘yyyy-mm-dd hh:ii:ss’); — 获取日期部分
time(‘yyyy-mm-dd hh:ii:ss’); — 获取时间部分
date_format(‘yyyy-mm-dd hh:ii:ss’, ‘%d %y %a %d %m %b %j’); — 格式化时间
unix_timestamp(); — 获得unix时间戳
from_unixtime(); — 从时间戳获得时间
— 字符串函数
length(string) — string长度,字节
char_length(string) — string的字符个数
substring(str, position [,length]) — 从str的position开始,取length个字符
replace(str ,search_str ,replace_str) — 在str中用replace_str替换search_str
instr(string ,substring) — 返回substring首次在string中出现的位置
concat(string [,…]) — 连接字串
charset(str) — 返回字串字符集
lcase(string) — 转换成小写
left(string, length) — 从string2中的左边起取length个字符
load_file(file_name) — 从文件读取内容
locate(substring, string [,start_position]) — 同instr,但可指定开始位置
lpad(string, length, pad) — 重复用pad加在string开头,直到字串长度为length
ltrim(string) — 去除前端空格
repeat(string, count) — 重复count次
rpad(string, length, pad) —在str后用pad补充,直到长度为length
rtrim(string) — 去除后端空格
strcmp(string1 ,string2) — 逐字符比较两字串大小
— 流程函数
case when [condition] then result [when [condition] then result …] [else result] end 多分支
if(expr1,expr2,expr3) 双分支。
— 聚合函数
count()
sum();
max();
min();
avg();
group_concat()
— 其他常用函数
md5();
default();
—// 存储函数,自定义函数 —————
— 新建
CREATE FUNCTION function_name (参数列表) RETURNS 返回值类型
函数体
- 函数名,应该合法的标识符,并且不应该与已有的关键字冲突。
- 一个函数应该属于某个数据库,可以使用db_name.funciton_name的形式执行当前函数所属数据库,否则为当前数据库。
- 参数部分,由”参数名”和”参数类型”组成。多个参数用逗号隔开。
- 函数体由多条可用的mysql语句,流程控制,变量声明等语句构成。
- 多条语句应该使用 begin…end 语句块包含。
- 一定要有 return 返回值语句。
— 删除
DROP FUNCTION [IF EXISTS] function_name;
— 查看
SHOW FUNCTION STATUS LIKE ‘partten’
SHOW CREATE FUNCTION function_name;
— 修改
ALTER FUNCTION function_name 函数选项
—// 存储过程,自定义功能 —————
— 定义
存储存储过程 是一段代码(过程),存储在数据库中的sql组成。
一个存储过程通常用于完成一段业务逻辑,例如报名,交班费,订单入库等。
而一个函数通常专注与某个功能,视为其他程序服务的,需要在其他语句中调用函数才可以,而存储过程不能被其他调用,是自己执行 通过call执行。
— 创建
CREATE PROCEDURE sp_name (参数列表)
过程体
参数列表:不同于函数的参数列表,需要指明参数类型
IN,表示输入型
OUT,表示输出型
INOUT,表示混合型
注意,没有返回值。

存储过程

/ 存储过程 / —————————
存储过程是一段可执行性代码的集合。相比函数,更偏向于业务逻辑。
调用:CALL 过程名
— 注意
- 没有返回值。
- 只能单独调用,不可夹杂在其他语句中
— 参数
IN|OUT|INOUT 参数名 数据类型
IN 输入:在调用过程中,将数据输入到过程体内部的参数
OUT 输出:在调用过程中,将过程体处理完的结果返回到客户端
INOUT 输入输出:既可输入,也可输出
— 语法
CREATE PROCEDURE 过程名 (参数列表)
BEGIN
过程体
END

用户和权限管理

/ 用户和权限管理 / —————————
— root密码重置
1. 停止MySQL服务
2. [Linux] /usr/local/mysql/bin/safe_mysqld —skip-grant-tables &
[Windows] mysqld —skip-grant-tables
3. use mysql;
4. UPDATE user SET PASSWORD=PASSWORD(“密码”) WHERE user = “root”;
5. FLUSH PRIVILEGES;
用户信息表:mysql.user
— 刷新权限
FLUSH PRIVILEGES;
— 增加用户
CREATE USER 用户名 IDENTIFIED BY [PASSWORD] 密码(字符串)
- 必须拥有mysql数据库的全局CREATE USER权限,或拥有INSERT权限。
- 只能创建用户,不能赋予权限。
- 用户名,注意引号:如 ‘user_name’@’192.168.1.1’
- 密码也需引号,纯数字密码也要加引号
- 要在纯文本中指定密码,需忽略PASSWORD关键词。要把密码指定为由PASSWORD()函数返回的混编值,需包含关键字PASSWORD
— 重命名用户
RENAME USER old_user TO new_user
— 设置密码
SET PASSWORD = PASSWORD(‘密码’) — 为当前用户设置密码
SET PASSWORD FOR 用户名 = PASSWORD(‘密码’) — 为指定用户设置密码
— 删除用户
DROP USER 用户名
— 分配权限/添加用户
GRANT 权限列表 ON 表名 TO 用户名 [IDENTIFIED BY [PASSWORD] ‘password’]
- all privileges 表示所有权限
- . 表示所有库的所有表
- 库名.表名 表示某库下面的某表
GRANT ALL PRIVILEGES ON pms. TO ‘pms’@’%’ IDENTIFIED BY ‘pms0817’;
— 查看权限
SHOW GRANTS FOR 用户名
— 查看当前用户权限
SHOW GRANTS; 或 SHOW GRANTS FOR CURRENT_USER; 或 SHOW GRANTS FOR CURRENT_USER();
— 撤消权限
REVOKE 权限列表 ON 表名 FROM 用户名
REVOKE ALL PRIVILEGES, GRANT OPTION FROM 用户名 — 撤销所有权限
— 权限层级
— 要使用GRANT或REVOKE,您必须拥有GRANT OPTION权限,并且您必须用于您正在授予或撤销的权限。
全局层级:全局权限适用于一个给定服务器中的所有数据库,mysql.user
GRANT ALL ON
.和 REVOKE ALL ON .只授予和撤销全局权限。
数据库层级:数据库权限适用于一个给定数据库中的所有目标,mysql.db, mysql.host
GRANT ALL ON db_name.
和REVOKE ALL ON db_name.*只授予和撤销数据库权限。
表层级:表权限适用于一个给定表中的所有列,mysql.talbes_priv
GRANT ALL ON db_name.tbl_name和REVOKE ALL ON db_name.tbl_name只授予和撤销表权限。
列层级:列权限适用于一个给定表中的单一列,mysql.columns_priv
当使用REVOKE时,您必须指定与被授权列相同的列。
— 权限列表
ALL [PRIVILEGES] — 设置除GRANT OPTION之外的所有简单权限
ALTER — 允许使用ALTER TABLE
ALTER ROUTINE — 更改或取消已存储的子程序
CREATE — 允许使用CREATE TABLE
CREATE ROUTINE — 创建已存储的子程序
CREATE TEMPORARY TABLES — 允许使用CREATE TEMPORARY TABLE
CREATE USER — 允许使用CREATE USER, DROP USER, RENAME USER和REVOKE ALL PRIVILEGES。
CREATE VIEW — 允许使用CREATE VIEW
DELETE — 允许使用DELETE
DROP — 允许使用DROP TABLE
EXECUTE — 允许用户运行已存储的子程序
FILE — 允许使用SELECT…INTO OUTFILE和LOAD DATA INFILE
INDEX — 允许使用CREATE INDEX和DROP INDEX
INSERT — 允许使用INSERT
LOCK TABLES — 允许对您拥有SELECT权限的表使用LOCK TABLES
PROCESS — 允许使用SHOW FULL PROCESSLIST
REFERENCES — 未被实施
RELOAD — 允许使用FLUSH
REPLICATION CLIENT — 允许用户询问从属服务器或主服务器的地址
REPLICATION SLAVE — 用于复制型从属服务器(从主服务器中读取二进制日志事件)
SELECT — 允许使用SELECT
SHOW DATABASES — 显示所有数据库
SHOW VIEW — 允许使用SHOW CREATE VIEW
SHUTDOWN — 允许使用mysqladmin shutdown
SUPER — 允许使用CHANGE MASTER, KILL, PURGE MASTER LOGS和SET GLOBAL语句,mysqladmin debug命令;允许您连接(一次),即使已达到max_connections。
UPDATE — 允许使用UPDATE
USAGE — “无权限”的同义词
GRANT OPTION — 允许授予权限

表维护

/ 表维护 /
— 分析和存储表的关键字分布
ANALYZE [LOCAL | NO_WRITE_TO_BINLOG] TABLE 表名 …
— 检查一个或多个表是否有错误
CHECK TABLE tbl_name [, tbl_name] … [option] …
option = {QUICK | FAST | MEDIUM | EXTENDED | CHANGED}
— 整理数据文件的碎片
OPTIMIZE [LOCAL | NO_WRITE_TO_BINLOG] TABLE tbl_name [, tbl_name] …

杂项

/ 杂项 / —————————
1. 可用反引号(`)为标识符(库名、表名、字段名、索引、别名)包裹,以避免与关键字重名!中文也可以作为标识符!
2. 每个库目录存在一个保存当前数据库的选项文件db.opt。
3. 注释:
单行注释 # 注释内容
多行注释 / 注释内容 /
单行注释 — 注释内容 (标准SQL注释风格,要求双破折号后加一空格符(空格、TAB、换行等))
4. 模式通配符:
_ 任意单个字符
% 任意多个字符,甚至包括零字符
单引号需要进行转义 \’
5. CMD命令行内的语句结束符可以为 “;”, “\G”, “\g”,仅影响显示结果。其他地方还是用分号结束。delimiter 可修改当前对话的语句结束符。
6. SQL对大小写不敏感
7. 清除已有语句:\c

MYSQL面试题集合