基础篇包括5章:
第一章绪论,初步讲解数据库基本概念,介绍数据模型的组成要素和常用数据模型、数据库系统三级模式结构和数据库系统的主要组成成分。
第一章 绪论
1.1 数据库系统概述
1.1.1 数据库的4个基本概念
- 数据(data):数据是描述事务的符号记录,且与语义不可分。
- 数据库(DataBase,DB):数据库是长期存储、有组织、可共享的大量数据的集合。特点是冗余度小、高独立性、易扩展性、共享性。
- 数据库管理系统(DataBase Management System,DBMS):是位于用户与操作系统之间的一层数据管理软件,用于科学管理数据库的存取。主要功能:
- 数据定义:提供数据定义语言(DDL);
- 数据组织、存储和管理:实现数据间的联系,目标是提高空间利用率与方便查找;
- 数据操纵:查询、插入、删除和修改(DML);
- 数据库的数据管理和运行管理:保证数据的安全性、完整性、多用户并发使用与故障恢复;
- 数据库的建立和维护:初始数据输入、转换,数据库存储、恢复,数据重组织、性能监视、分析等;
- 其他功能:与网络中其他软件系统的通信功能,数据转换功能,异构数据库之间的互访和互操作功能等;
- 数据库系统(DataBase System,DBS):数据库系统包括数据库、数据库管理系统、应用程序和数据库管理员(DBA)。
1.1.2 数据库管理技术的产生和发展
- 人工管理阶段
- 文件系统阶段
- 数据库系统阶段
1.1.3 数据库系统的特点
- 数据结构化
- 数据共享性高、冗余度低且易扩展
- 数据独立性高
- 数据由数据库管理系统统一管理和控制
1.2 数据模型
数据模型是对现实世界数据特征的抽象,是==数据库系统的核心和基础==。
1.2.1 两类数据模型
- 概念模型(信息模型)
- 逻辑模型和物理模型
1.2.2 概念模型
-
信息世界基本概念
- 实体(entity):客观存在并可互相区别的事物称为实体,一个职工、一个学生都是实体;
- 属性(attribute):实体所具有的某一特性称为属性;
- 码(key):唯一标识的属性集称为码,即主键;
- 实体型(entity type):用实体名及其属性名集合来抽象和刻画同类实体,称为实体型,如学生就是一个实体型;
- 实体集(entity):同一类实体的集合成为实体集;
- 联系:实体之间的联系有一对一、一对多、多对多等类型。
-
概念模型一种表示方法:实体-联系方法 实体-联系方法(Entity-Relationship approach),画E-R图表示。
1.2.3 数据模型的组成要素
- 数据结构:描述数据库的组成对象以及对象之间的联系,人们按照数据结构来命名数据模型,如层次、网状、关系模型;
- 数据操作:增删改、查操作;
- 数据的完整性约束条件:一组完整性的规则,限定数据模型的数据库状态和状态的变化,以确保数据的正确、有效和相容。
1.2.4 常用数据模型
- 层次模型
- 网状模型
- 关系模型
- 面向对象数据模型
- 对象关系数据模型
- 半结构化数据模型
1.2.5 层次模型
数据结构:树,根节点唯一,节点的双亲唯一;
数据操纵:增删改、查;
完整性约束:如果没有双亲节点值就不能插入它子女的节点值;
优点:结构简单清晰、查询效率高、提供了良好的完整性支持;
缺点:现实世界很多联系是非层次性的、不适用于一个节点具有多个双亲结点的关系、查询子女必须通过双亲节点、结构严密,层次命令趋于程序化;
1.2.6 网状模型
典型代表:DBTG系统,亦称CODASYL系统;
数据结构:图,多对多。层次模型中子女节点与双亲节点的联系是唯一的,而在网状模型中这种联系可以不唯一;
优点:更为直接地描述现实世界、存取效率高;
缺点:结构复杂、DDL和DML复杂、记录联系依赖存取记录;
1.2.7 关系模型
数据结构:二维表格;
数据操作:增删改、查;
完整性约束:实体完整性、参照完整性和用户定义的完整性;
优点:严格建立在数学概念的基础上的、关系模型的概念单一、关系模型的存取路径对用户透明,具有更高的数据独立性、更好的安全保密性,简化程序开发;
缺点:查询效率不如格式化数据模型;
1.3 数据库系统的结构
从开发人员的角度,数据库系统通常采用三级模式结构。
1.3.1 数据库系统模式的概念
在数据库中有“型”(type)和“值”(value)的概念。
模式是对数据库中全体数据的逻辑结构和特征的描述。
模式是相对稳定的,而实例是相对变动的。
1.3.2 数据库系统的三级模式结构
- 模式(schema):也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。在数据库系统模式结构中位于中间层,不涉及数据的物理存储,又与具体的应用程序无关。
- 外模式(external schema):也称子程序或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图是与某一应用有关的数据的逻辑表示。
- 内模式(internal schema):也称存储模式,一个数据库只有一个内模式。他是物理结构和存储方式的描述,是数据在数据库内部的组织方式。
1.3.3 数据库的二级映像功能与数据独立性
- 外模式/模式映像:当模式改变时,由数据库管理员对各个外模式/模式的映像作相应改变,可以使外模式保持不变。应用成熟时依据数据的外模式编写的,从而应用程序不必修改,保证了数据的逻辑独立性。
- 模式/内模式映像:当数据库的存储结构改变时,由数据库管理员对模式/内模式映像作相应改变,可以使模式保持不变,从而应用程序也不必改变。保证了数据与程序的物理独立性,简称数据的物理独立性。
1.4 数据库系统的组成
- 硬件平台及数据库:大内存(存放软件、缓冲区)、大磁盘(存数据库)、较高通道能力(提高数据传送率);
- 软件:数据库管理系统、操作系统、高级语言编译系统、开发工具、为特定应用环境开发的数据库应用系统;
- 人员:数据库管理人员、系统分析员和数据库设计人员、应用程序员、用户;
1.5 小结
-
数据模型是数据库系统的核心和基础。本章简要介绍概念模型、数据模型三要素和三种数据库模型; -
介绍数据库系统内部系统结构。三级模式和两层映射关系保证数据库系统的逻辑独立性和物理独立性。; -
最后介绍了数据库系统的组成,使读者了解数据库系统不仅是一个计算机系统,而是一个人-机系统,人(特别是数据库管理人员)的作用尤为重要。
|