一.基本概念

1.数据库的有关概念:

(1)数据(Data):数据是数据库中存储的基本对象,它是描述事物的符号记录
(2)数据库(Database):数据库是长期储存在计算机内、有组织的、可共享的大量数据的集合(行列结构构成的二维表的集合)
(3)数据库管理系统(DBMS):数据库管理系统是位于用户与操作系统之间的一层数据管理软件,它是一个大型复杂的软件系统,它主要用于科学地组织和存储数据、高效地获取和维护数据
(4)数据库系统(DBS):数据库系统主要是由数据库、数据库管理系统(及其开发工具)、数据库管理员以及应用程序所构成的一套人机系统
(5)关系数据库:建立在关系模型基础上的数据库,由多张能互相联接的二维行列表格组成的数据库

2.数据库的特征:

(1)数据按一定的数据模型组织、描述和储存
(2)可为各种用户共享
(3)冗余度较小(相同数据存放的次数)
(4)数据独立性较高
(5)易扩展

3.数据库管理系统的主要功能:

(1)数据定义功能:提供数据定义语言(DDL) 定义数据库中的数据对象
(2)数据组织、存储和管理功能:分类组织、存储和管理各种数据,确定组织数据的文件结构和存取方式,实现数据之间的联系提供多种存取方法提高存取效率
(3)数据操纵功能:提供数据操纵语言(DML) 实现对数据库的基本操作 (查询、插入、删除和修改)
(4)数据库的事务管理和运行管理:数据库在建立、运行和维护时由DBMS统一管理和控制,保证数据的安全性、完整性、多用户对数据的并发使用,发生故障后的系统恢复
(5)数据库的建立和维护功能(实用程序):数据库初始数据装载转换,数据库转储,介质故障恢复,数据库的重组织,性能监视分析等
(6)其它功能:DBMS与网络中其它软件系统的通信,两个DBMS系统的数据转换,异构数据库之间的互访和互操作

4.数据库系统的组成(简称数据库):

(1)数据库 Database
(2)操作系统
(3)数据库管理系统(及其开发工具)Database Management System
(4)应用系统
(5)数据库管理员 Database Administrator

5.数据库系统的特点:

(1)数据结构化
(2)数据的共享性高,冗余度低且易扩充
(3)数据独立性高

  1. 数据独立性由数据库管理系统的二级映像功能来保证,它主要分为:物理独立性和逻辑独立性。
  2. 物理独立性:指用户的应用程序与数据库中数据的物理存储是相互独立的,当数据的物理存储改变了,应用程序不用改变。
  3. 逻辑独立性:指用户的应用程序与数据库中数据的逻辑结构是相互独立的,当数据的逻辑结构改变了,应用程序不用改变。

(4)数据由数据库管理系统统一管理和控制

  1. 数据库管理系统提供的数据控制功能。
  2. (1)数据的安全性(Security)保护:保护数据以防止不合法的使用造成的数据的泄密和破坏。
  3. (2)数据的完整性(Integrity)检查:保证数据的正确性、有效性和相容性。
  4. (3)并发(Concurrency)控制:对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。
  5. (4)数据库恢复(Recovery)技术:将数据库从错误状态恢复到某一已知的正确状态。

二.数据模型

1.简介:

(1)定义:数据模型是对现实世界数据特征的抽象,通俗地讲数据模型就是现实世界的模拟,数据模型是数据库系统的核心和基础。
(2)要求:能比较真实地模拟现实世界;容易为人所理解;便于在计算机上实现。
(3)分类:

  • 概念模型:概念模型也称信息模型,它是按用户的观点来对数据和信息建模,用于数据库设计。
  • 逻辑模型和物理模型:逻辑模型主要包括层次模型、网状模型、关系模型、面向对象数据模型、对象关系数据模型、半结构化数据模型等。按计算机系统的观点对数据建模,用于DBMS实现。物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。

(4)客观对象抽象过程:

  • 先把现实世界的客观对象抽象为概念模型
  • 再把概念模型转化为某一DBMS支持的数据模型

    2.数据模型的组成

    (1)数据结构:描述数据库的组成对象,以及对象之间的联系,它是对系统静态特性的描述。
    (2)数据操作:对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则
    它是对系统动态特性的描述。数据操作的类型:查询,更新(包括插入、删除、修改)
    (3)数据的完整性约束:是一组完整性规则的集合,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容。

  • 完整性规则:给定的数据模型中数据及其联系所具有的制约和依存规则。

    3.概念模型:

    (1)用途:

  • 概念模型用于信息世界的建模

  • 是现实世界到机器世界的一个中间层次
  • 是数据库设计的有力工具
  • 数据库设计人员和用户之间进行交流的语言

(2)要求:较强的语义能力,简单清晰 易于用户理解
(3) 表示方法:实体-联系方法(E-R图) E-R方法也称为E-R模型

  • 实体型:矩形表示,内写实体名
  • 属性:椭圆形表示,并用无向边将其与相应的实体连接起来
  • 联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1、1:n或m:n)
  • 联系的属性:如果一个联系具有属性,则这些属性也要用无向边与该联系连接起来

(4)信息世界中的基本概念:

  • 实体(Entity):客观存在并可相互区别的事物称为实体。
  • 属性(Attribute):实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。例如学生实体可以由学号、姓名、性别、出生年份、系、入学时间等属性组成。(94002268,张山,男,1976,计算机系,1994)这些属性组合起来表征了一个学生。
  • 码(Key):唯一标识实体的属性集称为码。例如学号是学生实体的码。
  • 域(Domain):属性的取值范围称为该属性的域。例如,学号的域为8位整数,姓名的域为字符串集合,年龄的域为小于38的整数,性别的域为(男,女)。
  • 实体型(Entity Type) :具有相同属性的实体必然具有共同的特征和性质。用实体名及其属性名集合来抽象和刻画同类实体,称为实体型。例如,学生(学号,姓名,性别,出生年份,系,入学时间)就是一个实体型。
  • 实体集(Entity Set):同型实体的集合称为实体集。例如,全体学生就是一个实体集。
  • 联系(Relationship) :在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息世界中反映为实体(型)内部的联系和实体(型)之间的联系。实体内部的联系通常是指组成实体的各属性之间的联系。实体之间的联系通常是指不同实体集之间的联系。

(5)两个实体型间的联系

  • 一对一联系(1 : 1):如果对于实体集A中的每一个实体,实体集B中至多有一个(也可以没有)实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记为1 : 1。例如,学校里面,一个班级只有一个正班长,而一个班长只在一个班中任职,则班级与班长之间具有一对一联系。
  • 一对多联系(1 : n):如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系,记为1 : n。例如,一个班级中有若干名学生,而每个学生只在一个班级中学习,则班级与学生之间具有一对多联系。
  • 多对多联系(m : n):如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m≥0)与之联系,则称实体集A与实体集B具有多对多联系,记为m : n。

    三.常见的数据模型

    1.层次模型:用树状层次结构来组织数据的数据模型

    (1)满足下面两个条件的基本层次联系的集合为层次模型:

  • 有且只有一个结点没有双亲结点,这个结点称为根结点。

  • 根以外的其它结点有且只有一个双亲结点。

(2)特点:

  • 结点的双亲是唯一的。
  • 只能直接处理一对多的实体联系。
  • 每个记录类型可以定义一个排序字段,也称为码字段。
  • 任何记录值只有按其路径查看时,才能显出它的全部意义。
  • 没有一个子女记录值能够脱离双亲记录值而独立存在。

image.png

2.网状模型:用有向图表示实体和实体之间的联系的数据结构模型称为网状数据模型

(1)满足下面两个条件的基本层次联系的集合称为网状数据模型:

  • 允许一个以上的节点无双亲
  • 一个节点可以有多于一个的双亲

(2)完整性约束条件:

  • 一个联系中双亲记录与子女记录之间是一对多联系。
  • 支持双亲记录和子女记录之间某些约束条件。

(3)优缺点:

  • 优点:能够更为直接地描述现实世界,如一个结点可以有多个双亲;具有良好的性能,存取效率较高。
  • 缺点;结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握;

DDL、DML语言复杂,用户不容易使用;记录之间联系是通过存取路径实现的,用户必须了解系统结构的细节
image.png

3.关系模型:使用表格表示实体和实体之间关系的数据模型称之为关系数据模型

(1)定义:使用表格表示实体和实体之间关系的数据模型称之为关系数据模型
(2)特点:

  • 关系数据模型中,无论是是实体、还是实体之间的联系都是被映射成统一的关系—一张二维表,在关系模型中,操作的对象和结果都是一张二维表,它由行和列组成。
  • 关系型数据库可用于表示实体之间的多对多的关系,只是此时要借助第三个关系—表,来实现多对多的关系。
  • 关系必须是规范化的关系,即每个属性是不可分割的实体,不允许表中表的存在。

(3)常见术语:
image.png
(4)关系模式:关系名(属性1,属性2….属性n)
(5)数据操作:数据操作是集合操作,操作对象和操作结果都是关系
(6)完整性约束条件:实体完整性;参照完整性;用户定义的完整性。
(7)优缺点:

  • 优点:
    • 建立在严格的数学概念的基础上。
    • 概念单一。
    • 关系模型的存取路径对用户透明。
  • 缺点:

    • 存取路径对用户透明,查询效率往往不如格式化数据模型。
    • 为提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度。

      四.数据库系统的结构

      1.模式:

      (1)数据库逻辑结构和特征的描述
      (2)是型的描述,不涉及具体值
      (3)反映的是数据的结构及其联系
      (4)模式是相对稳定的

      2.实例:

      (1)模式的一个具体值
      (2)反映数据库某一时刻的状态
      (3)同一个模式可以有很多实例
      (4)实例随数据库中的数据的更新而变动

      3.三级模式结构:外模式 模式 内模式

      (1)模式:也称逻辑模式 数据库中全体数据的逻辑结构和特征的描述;所有用户的公共数据视图。
      (2)外模式:也称子模式或用户模式 数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述 数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
      (3)内模式:也称存储模式 是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。
      image.png

      4.二级映像功能:保证了数据库外模式的稳定性;从底层保证了应用程序的稳定性,除非应用需求本身发生变化,否则应用程序一般不需要修改

      (1)外模式/模式映像:保证数据的逻辑独立性。
  • 当模式改变时,数据库管理员对外模式/模式映象作相应改变,使外模式保持不变。

  • 应用程序是依据数据的外模式编写的,应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。

(2)模式/内模式映像:保证数据的物理独立性。

  • 当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变。
  • 应用程序不受影响。保证了数据与程序的物理独立性,简称数据的物理独立性。

    五.数据库系统的组成

    1.组成:

    (1)数据库
    (2)数据库管理系统(及其开发工具)
    (3)数据库管理员
    (4)应用程序

    2.数据库管理员职责

    (1)决定数据库中的信息内容和结构。
    (2)决定数据库的存储结构和存取策略。
    (3)定义数据的安全性要求和完整性约束条件。
    (4)监控数据库的使用和运行。
    (5)数据库的改进和重组。