一、信息、数据、数据处理和数据管理

(1)信息及其特征

信息是人脑对现实世界事物的存在方式、运动状态以及事物之间联系的抽象反映。
image.png
image.png

(2)数据及其表现形式

  • 数据是用来记录信息的可识别的符号组合,是信息的具体表现形式。
  • 数据和它的语义是不可分割的,给数据赋予不同的语义,对数据有不同的解释。
  • 当给数据赋予特定语义后,它们就转换为可传递的信息。

    数据有不同的表现形式,包括数字,还包括文字、图形、图像、声音和视频等,它们都可以经过数字化后存储到计算机中。
    如“参加了该考试的人数是500名,考试通过率是80%”,其中的数据“500”和“80%”可改为汉字形式“伍佰”和“百分之八十”,表达的信息是一致的。

(3)信息与数据的联系

  • 数据是信息的符号表示
  • 信息是数据的内涵,是对数据的语义解释

    如,上例中的数据“500”和“80%”被赋予了特定的语义,此处的“500”表示 “考试人数为500”,80%表示“考试通过率是80%”。

image.png

(4)数据处理和数据管理

image.png

“数据处理”的真正含义应该是为了产生信息而处理数据

二、数据库技术的发展

(1)人工管理阶段

  • 数据没有专门的存取设备
  • 数据没有专门的管理软件
  • 数据不共享
  • 数据不具有独立性

image.png

(2)文件系统阶段

  • 数据以文件形式长期保存
  • 由文件系统管理数据
  • 程序与数据间有一定独立性
  • 文件的形式已经多样化
  • 数据具有一定的共享性

image.png

文件系统的弊端

  1. 数据共享性差,数据冗余和不一致
  • 数据冗余是指相同的数据在不同的地方(文件)重复存储
  • 文件系统中的一个(或一组)文件基本上对应于一个应用程序,不同应用程序之间很难共享相同数据
  • 如何有效地提高不同应用共享数据的能力成为急需解决的问题
  1. 数据独立性差
  • 文件系统中的文件组是为某一特定应用服务的,其逻辑结构对于该特定应用程序来说是优化的,但是系统不易扩充
  • 因此,数据与应用程序之间缺乏逻辑独立性
  • 如何有效地提高数据与应用程序之间的独立性成为急需解决的问题
  1. 数据孤立,数据获取困难
  • 对于数据与数据之间的联系,文件系统仍缺乏有效的管理手段
  • 如何有效地管理数据与数据之间的联系成为急需解决的问题
  1. 完整性问题
  • 数据的完整性是指数据的正确性、有效性和相容性,也称为一致性约束
  • 例如,一个学生需要选修某门课程,该学生必须已经修过了该课程规定的先修课程时才能选修(因为课程之间存在先修后修关系);必须在该教学班尚未选满时才能选修(因为教室容量有限);必须在时间上与其它已经选修的课程不冲突时才能选修
  • 如何有效地表达和实现一致性(即完整性)约束成为急需解决的问题
  1. 安全性问题
  • 一个系统可能有很多用户,不同用户可能只允许其访问一部分数据,即该用户只有一部分数据的访问权限
  • 如何有效地保障数据的安全性就成为急需解决的问题
  1. 原子性问题
  • 计算机系统有时会发生故障,一旦故障发生并被检测到,数据就应该恢复到故障发生前的状态
  • 例如,学生选课时,不仅要在选课文件中增加某学生选修某门课的记录,同时也要在该课程教学班记录中将已选课人数加1,以便学生选课时进行容量控制
  • 因此,增加选课记录选课人数加1两个操作要么都发生,要么都不发生,这就是学生选课操作的原子性要求
  • 如何有效地保障操作的原子性就成为急需解决的问题
  1. 并发访问异常
  • 系统应该允许多个用户同时访问数据,在这样的环境中由于并发更新操作相互影响,可能会导致数据的不一致
  • 如何有效地进行并发控制(即确保并发操作正确性)就成为急需解决的问题

    (3)数据库系统阶段

  1. 20世纪60年代后期以来
  2. 数据管理对象的规模越来越大,应用范围越来越广,多种应用共享数据的要求越来越强烈
  3. 数据库管理系统(DBMS)是由一个相互关联的数据的集合和一组用以访问、管理和控制这些数据的程序组成
  4. 这个数据集合通常称为数据库(database, DB),其中包含了关于某个企业信息系统的所有信息
  5. DBMS是位于用户与操作系统之间的一层数据管理软件,它提供一个可以方便且高效地存取、管理和控制数据库信息的环境
  6. DBMS和操作系统一样,都是计算机的基础软件(系统软件),也是一个大型复杂的软件系统
  7. 设计数据库管理系统的目的是为了有效地管理大量的数据,既涉及到数据存储结构的定义,又涉及到数据操作机制的提供
  8. 解决文件处理系统中存在的问题:

    • 数据共享性差(数据冗余和不一致)
    • 数据独立性差
    • 数据孤立和数据获取困难
    • 完整性问题
    • 原子性问题
    • 并发访问异常
    • 安全性问题

      数据库管理系统的主要特点

  9. 数据结构化。

数据库管理系统实现数据的整体结构化,这是数据库的主要特征之一,也是数据库管理系统与文件系统的本质区别。

  • 一是指:数据不仅仅是内部结构化,而是将数据以及数据之间的联系统一管理起来,使之结构化。

image.png

  • 二是指:在数据库中的数据不是仅仅针对某一个应用,而是面向全组织的所有应用
  • 例如,一个学校的信息系统中不仅要考虑教务处的学生成绩管理,还要考虑学工处的学籍注册管理、学生奖惩管理、学生家庭成员管理,以及财务处的学生缴费管理;同时还要考虑研究生院的研究生管理、科研处的科研管理、人事处的教职工人事管理工资管理等。
  • 因此,学校信息系统中的学生数据要面向全校各个职能管理部门和院系的应用,而不仅仅是教务处的一个学生成绩管理应用。

image.png

  1. 数据的共享度高,冗余度底,易扩充
  • 数据库管理系统从整体角度描述和组织数据,数据不再是面向某个应用,而是面向整个系统
  • 因此,数据可以被多个用户、多个应用共享使用
  • 数据共享可以大大减少数据的冗余,避免数据之间的不一致性
  1. 数据独立性高
  • 数据独立是指数据的使用(即应用程序)与数据的说明(即数据的组织结构与存储方式)分离
    • 这样,应用程序只需要考虑如何使用数据,而无须关心数据库中的数据是如何构造和存储的
    • 因而,各方(在一定范围内)的变更互不影响
  • 数据独立性用来描述应用程序数据结构之间的依赖程度,包括数据的物理独立性和数据的逻辑独立性,依赖程度越低则独立性越高
  • 物理独立性是指用户的应用程序与数据库中数据的物理结构是相互独立的。数据在磁盘上如何组织和存储由DBMS负责,应用程序只关心数据的逻辑结构;当数据的物理存储结构改变时,应用程序不用修改
  • 逻辑独立性是指用户的应用程序与数据库中数据的逻辑结构是相互独立的。数据的(全局)逻辑结构由DBMS负责,应用程序只关心数据的局部逻辑结构(即应用视图),数据的(全局)逻辑结构改变了,应用程序也可以不用修改
  1. 数据由数据库管理系统(DBMS)统一管理和控制
  • 数据的安全性保护:保护数据以防止不合法的使用造成数据的泄密和破坏
  • 数据的完整性检查:将数据控制在有效的范围内,或保证数据之间满足一定的关系
  • 并发控制:对多个用户或应用同时访问同一个数据的并发操作加以控制和协调,确保得到正确的修改结果或数据库的完整性不遭到破坏
  • 数据库恢复:当计算机系统发生硬件或软件故障时,需要将数据库从错误状态恢复到某一已经正确状态

image.png

数据库应用

图书馆管理、书店管理、教学管理、科研管理