概念
??????????????????????????????????????????????????????????????????????????????????? (注:黄色=缩写;红色=重点;绿色=补充)
- 数据(Data)是描述事务的符号记录。数据经过加工后成为信息。数据与语义密不可分。
- 数据库(Database,DB)是长期存储在计算机内的有组织的,可共享的数据集合。
- 数据库管理系统(Database Management System,DBMS)是位于操作系统与用户之间的一层管理软件,是数据库系统的核心。主要功能:数据定义(DDL)即数据大小之类;数据操纵(DML)即增删改查之类;数据库的建立维护;数据库的运行管理;提供方便有效的存储数据库的接口和工具(提供给数据库管理人员,DBA)
- 数据库系统(Database System,DBS)是指引入数据库技术的计算机系统,包括数据库和数据库管理系统。
- 数据结构化:在数据库系统中,数据不再针对某一应用而是面向全局应用,具有整体的机构化。
- 数据冗余度小:(数据冗余是指数据在存储器中的不必要的多次重复存储。)
- 数据共享性好:(数据共享就是让在不同地方使用不同计算机、不同软件的用户能够读取他人数据并进行各种操作、运算和分析。)
- 数据库保护:数据安全性;数据完整性;并发控制;故障恢复。
- 数据独立性高:(数据独立性是指应用程序和数据结构之间相互独立, 互不影响。) ? ? ?????? 数据独立性解释:三级模式:外模式(用户角度),模式(逻辑特征),内模式(物理存储)。二级映射:外模式与模式(逻辑独立性),模式与内模式(物理独立性)。
- 范式是符合某一种级别的关系模式的集合。关系数据库中的关系必须满足一定的要求,满足不同程度要求的为不同范式。简而言之,范式即为规范的式子。
- 一范式:1NF(第一范式)是指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。如果出现重复的属性,就可能需要定义一个新的实体,新的实体由重复的属性构成,新实体与原实体之间为一对多关系。在第一范式1NF中表的每一行只包含一个实例的信息。简而言之,第一范式就是无重复的列。
- 二范式:2NF(第二范式)是指每个表必须有主关键字(Primary key),其他数据元素与主关键字一一对应。通常称这种关系为函数依赖(Functional dependence)关系,即表中其他数据元素都依赖于主关键字,或称该数据元素唯一地被主关键字所标识。第二范式是数据库规范化中所使用的一种正规形式。它的规则是要求数据表里的所有非主属性都要和该数据表的
主键有完全依赖关系;如果有哪些非主属性只和主键的一部份有关的话,它就不符合第二范式。同时可以得出:如果一个数据表的主键只有单一一个字段的话,它就一定符合第二范式(前提是该数据表符合第一范式)。 - 三范式:3NF (第三范式)就是指表中的所有数据元素不但要能唯一地被主关键字所标识,而且它们之间还必须相互独立,不存在其他的函数关系。也就是说,对于一个满足2nd NF 的数据结构来说,表中有可能存在某些数据元素依赖于其他非关键字数据元素的现象,必须消除。
- BC范式:对于关系模式R,若 R为第一范式,且每个属性都不部分依赖于候选键也不传递依赖于候选键那么称R是BC范式,BCNF相对于第三范式,BC范式的要求更加严格。第三范式只是要求R为第二范式且非键属性不传递依赖于R的候选键,而BC范式则是对R的每个属性都做要求。
- 依赖:部分函数依赖:在关系模式中,如果X→(推出)Y,并且存在X的一个真子集X0,使得X0→Y,则称Y对X部分函数依赖。完全函数依赖:关系模式中,X、Y为属性集,若X → Y,且对X中的任何真子集X’ ,那么X’ ? Y 都成立,则称Y完全函数依赖于X。传递函数依赖:设X,Y,Z是关系R中互不相同的属性集合,存在X→Y(Y ?X),Y→Z,则称Z传递函数依赖于X。
- ?应用结构:客户/服务器结构(Client/Sever,C/S)例:QQ,微信。浏览器服务器结构(Broswer/Sever,B/S)例:网站。
- ?概念模型:用来描述现实世界的事物,与具体的计算机系统无关。最典型的概念是实体联系(E-R图)即软件工程中的内容。实体:客观存在并相互区别的事物。联系:实体与实体之间的联系。属性:实体或联系的特征。实体间的关系:一对一、一对多、多对多。E-R图中(实体→矩形,属性→椭圆,联系→菱形)
- 逻辑模型:是具体的DBMS所支持的数据模型。一、层次模型。二、网状模型:表示实体和实体之间的联系。三、关系模型:用二维表结构来表示实体与实体间的模型。四、面向对象模型。
- 物理模型:用于描述数据在存储介质上的组织结构。
- 关系:本是是一种二维表。通常将一个无重复行、重复列的二维表看成一个关系,每一个关系都有一个关系名。
- 表:也称作关系,表的结构称作关系模式。
- 列:表中的列称作字段或者属性,且每一列有同一数据类型,列名不能重复。
- 行:表中的行成为元组或记录,一行就是一条记录或者一个元组。
- 关键字(Key):称作码或主键,表中能够唯一确定一个元组的属性或属性组。
- 候选键:如果表中有多个能够唯一标识一个元组的属性,称之为候选键。候选键中任选一个可做主键。
- 外部关键字(Foreign Key):称作外键,如果一个字段不是本表的主键或候选键,而是另外一个表的主键或候选键,称之为外键。
- 域:标识属性的取值范围。
- 数据类型:表中的每一列存储内容的限制格式,每列有且只有一个数据类型,一列数据属于一类数据类型。
- 性质:a.每列不可再分;b.表的任意两个元组(行)不能完全相同;c.表中每一列属于同一数据类型,且列值出自同一域;d.不同列可以出自同一域,但列名不能相同;e.表中列的顺序可以任意交换,行的顺序也可以任意交换。
- 需求分析:进行数据库设计首先必须准确了解和分析用户需求(包括数据与处理)。
- 概念结构设计:是整个数据库设计的关键,生成E-R图。
- 逻辑结构设计:是将概念结构转换为某个DBMS所支持的数据模型,并将进行优化。E-R图转换为关系模型。
- 物理结构设计:物理设计是为逻辑数据结构模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)
- 数据库实施:数据库实施阶段,设计人员运营DBMS提供数据库语言(如SQL)及其宿主语言,根据逻辑设计和物理设计的结果建立数据库,编制和调试应用程序,组织数据入库,并进行试运行。
- 数据库运行与维护:数据库应用系统经过是运行后,即可投入正式运行,在数据库系统运行过程中必须不断地对其进行评价,调整,修改。
- 概念结构的设计方法:设计概念结构通常有四类方法:自顶向下(即首先定义全局概念结构的框架,再逐步细化);自底向上(即首先定义各局部应用的概念结构,然后再将他们集成起来,得到全局概念结构。);逐步扩张:(首先定义最重要的核心概念结构,然后向外扩张,以滚雪球的方式逐步生成其他的概念结构,直至总体概念结构。);混合策略(即自顶向下和自底向上相结合。)
- 逻辑结构的设计方法:主要任务将E-R图转换为关系模型。遵循原则:a.一个实体型转一个关系模式;b.一对一(1:1)关系可转换成一个关系模式,或与之对应一端关系模式合并c.一对多(1:N)转换为一个独立关系模式;d.多对多(N:M)转换时,关系模式为联系各实体的码(主键)以及联系本身的属性。
- 关系数据库设计的方法:a.三个或三个以上实体间的转换,关系模式为各联系实体的码和联系本身的属性; b:具有相同码的关系模式可合并。
- Mysql是一个小型关系型数据库管系统,开发者为瑞典Mysql AB公司。目前Mysql被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,许多中小型网站为了降低网站总体拥有成本而选择了Mysql作为网站数据库。与其他的大型数据库相比,Mysql还有一些不足之处,但是这些丝毫没有减少它受欢迎的程度。对于一般的个人使用者和中小型企业来说,Mysql提供的功能已经绰绰有余,而且由于Mysql是开放源码软件,因此可以大大降低总体拥有成本。
|