数据库系统-概述
数据库技术是数据管理的最新技术,是计算机科学技术中发展最快的领域之一,也是应用最广的技术之一,它是专门研究如何科学地组织和存储数据,如何高效地获取和处理数据的技术。它已成为各行各业存储数据、管理信息、共享资源和决策支持的最先进、最常用的技术。
数据库(Database),简单地说就是数据的仓库,即数据存放的地方。在现实世界中,存在许多数据库的例子,如手机通信录是一个关于联系人信息的小型数据库,图书馆则是一个各类馆存图书的大型数据库。小型数据库尚可用手工管理,而大型数据库必须由计算机辅助管理。在计算机三大主要应用领域(科学计算、过程控制和数据处理)中,数据处理所占比例约为70%。
信息、数据、数据处理与数据管理
信息
信息(Information)的定义:信息是人脑对现实世界事物的存在方式、运动状态以及事物之间联系的抽象反映。
信息是客观存在的,人类有意识地对信息进行采集并加工、传递,从而形成了各种消息、情报、指令、数据及信号等。
例如,对于学生基本情况来说,某同学的学号是“A1”,姓名是“小红”,性别是“女”,年龄是“17岁”,所在系别是“计算机”等,这些都是关于某个同学的具体信息,是该同学当前存在状态的反映。
信息的特征
- 信息源于物质和能量。信息不可能脱离物质而存在,信息的传递需要物质载体,信息的获取和传递要消耗能量,如信息可以通过报纸、电台、电视和计算机网络进行传递。
- 信息是可以感知的。人类对客观事物的感知,可以通过感觉器官,也可以通过各种仪器仪表和传感器,不同的信息源有不同的感知形式。如报纸上刊登的信息通过视觉器官感知,电台中广播的信息通过听觉器官感知。
- 信息是可存储、加工、传递和再生的。人们用大脑存储信息,叫做记忆。计算机存储器、录音、录像等技术的发展,进一步扩大了信息存储的范围。借助计算机,还可对收集到的信息进行整理。
数据
数据(Data)的定义。数据是由用来记录信息的可识别的符号组合的,是信息的具体表现形式。
数据和它的语义是不可分割的。例如,对于数据:(小红,计算机),可以赋予它相关的语义,即学生“小红”属于“计算机”系。如果不了解其语义,则无法对数据进行正确解释,甚至解释为“小红”学习的课程为“计算机”。
数据的表现形式不仅包括数字,还包括文字、图形、图像、声音和视频等,它们都可以经过数字化后存储到计算机中。
数据与信息的联系
信息=数据+语义
数据表示了信息,而信息只有通过数据形式表示出来才能被人们理解和接受。
数据处理与数据管理
数据处理是将数据转换成信息的过程,包括对数据的收集、管理、加工利用乃至信息输出等一系列活动。其目的之一是从大量的原始数据中抽取和推导出有价值的信息,作为决策的依据;目的之二是借助计算机科学地保存和管理大量复杂的数据,以便人们能够方便地充分利用这些信息资源。
在数据处理过程中,数据是原料,是输入;而信息是产出,是输出结果。“数据处理”的真正含义应该是为了产生信息而处理数据。
在数据处理中,数据管理过程比较复杂,主要包括数据的分类、组织、编码、存储、维护、检索等操作。
对于这些数据管理的操作,应研制一个通用、高效而又使用方便的管理软件,把数据有效地管理起来,以便最大限度地减轻程序员管理数据的负担;至于处理业务中的加工计算,因不同业务而存在实现上的差异,要靠程序员根据实际业务情况编写相关应用程序加以解决。所以,数据管理是与数据处理相关的必不可少的环节,其技术的优劣将直接影响数据处理的效果。
数据库技术正是瞄准这一目标而研究、发展并完善起来的。
数据库技术的产生、发展
数据处理的中心问题是数据管理
随着计算机硬件和软件的发展,数据管理经历了人工管理、文件系统和数据库系统三个发展阶段。
人工管理阶段
在20世纪50年代中期以前,计算机主要用于科学计算,当时只有卡片、纸带和磁带,没有磁盘等直接存取设备,机器通过指定位置是否存在空洞确定该位置的二进制数值。
软件只有汇编语言,没有操作系统和管理数据的软件。所以,为了给程序提供科学计算和数据处理的数据,必须手工制作穿孔纸带。因此,称这样的数据管理方式为人工管理数据。
特点
- 数据没有专门的存取设备
- 数据没有专门的管理软件
- 数据不共享
- 数据不具有独立性
- 程序与数据之间是一一对应的关系
文件系统阶段
在20世纪50年代后期至60年代中期,计算机应用范围逐步扩大,不仅用于科学计算,还大量用于信息管理。随着数据量的增加,数据的存储、检索和维护成为紧迫的需要。
此时,在硬件方面,已有了磁盘、磁鼓等数据存取设备;在软件方面,出现了高级语言和操作系统,操作系统中有了专门管理数据的软件。
特点
- 数据以文件形式长期保存
- 由文件系统管理数据
- 程序与数据间有一定独立性
- 文件的形式已经多样化
- 数据具有一定的共享性
缺点
- 数据共享性差、冗余度大
- 数据不一致性
- 数据独立性差
- 数据间的联系弱
应用程序与数据的对应关系
数据库系统阶段
从20世纪60年代后期开始,计算机用于管理的规模更加庞大,应用越来越广泛,数据量急剧增加,同时,多种应用、多种语言互相覆盖地共享数据集合的要求也越来越强烈。
为解决多用户、多个应用程序共享数据的需求,数据库技术应运而生,出现了统一管理数据的专门软件系统,即数据库管理系统(Data BaseManagement System,DBMS)。
数据库系统阶段管理数据的特点
- 结构化的数据及其联系的集合
- 数据共享性高、冗余度低
- 数据独立性高
- 有统一的数据管理和控制功能
数据库系统的数据共享机制示意图
在数据库系统中,整个数据库的结构可分成三级:用户逻辑结构、数据库逻辑结构和物理结构。数据独立性分为两级:物理独立性和逻辑独立性
数据的物理独立性是指当数据库物理结构(如存储结构、存取方式、外部存储设备等)改变时,通过修改映射,使数据库逻辑结构不受影响,进而用户逻辑结构以及应用程序不用改变。
数据的逻辑独立性是指当数据库逻辑结构(如修改数据定义、增加新的数据类型、改变数据间的关系等)发生改变时,通过修改映射,用户逻辑结构以及应用程序不用改变。
为确保数据库数据的正确、有效和数据库系统的有效运行,数据库管理系统提供下述4个方面的数据控制功能:
- 数据的安全性(Security)控制
- 数据的完整性(Integrity)控制
- 并发(Concurrency)控制
- 数据恢复(Recovery)
数据库系统阶段应用程序与数据之间的关系
|