IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 数据库概念总结(期末考试) -> 正文阅读

[大数据]数据库概念总结(期末考试)

期末考试时自己写的一些总结!

第1章:绪论

1、数据库是长期储存在计算机内的、有组织的、可共享的、大量数据的集合。

2、数据库系统的三级模式结构
1)模式:也称为逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,所有用户的公共数据视图,综合了所有用户的需求。一个数据库只有一个模式。模式是数据库系统模式结构的中间层,与数据的物理存储细节和硬件环境无关,与具体的应用程序、开发工具及高级程序设计语言无关。
2)外模式:也称子模式或用户模式,是数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。外模式介于模式与应用之间。
3)内模式:也也称存储模式,是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。一个数据库只有一个内模式。

3、三级模式的关系
数据按外模式的描述提供给用户,按内模式的描述存储在磁盘中,而模式则提供了连接这两级的相对稳定的中间观点,并使得两级中任何一级的改变不受另一级的牵制。

4、数据库的二级映像功能
1)外模式/模式映像:模式描述了数据的全局逻辑结构,外模式描述了数据的局部逻辑结构,同一个模式可以有任意多个外模式。每一个外模式,数据库系统都有一个外模式/模式映象,定义外模式与模式之间的对应关系。这些映象定义通常包含在各自外模式的描述中。外模式/模式映象用途:保证数据的逻辑独立性。
2)模式/内模式映像:模式/内模式映象定义了数据全局逻辑结构与存储结构之间的对应关系。例如,说明逻辑记录和字段在内部是如何表示的。数据库中模式/内模式映象是唯一的,该映象定义通常包含在模式描述中。模式/内模式映象的用途:保证数据的物理独立性。

第5章:数据库完整性

1、用户定义在关系表上的一类由事件驱动的特殊过程,一旦定义,任何用户对表的增加、修改和删除工作均由服务器自动激活相应的触发器,在DBMS核心层进行集中的完整性控制。

2、触发器类似于约束,但是比约束更加灵活,可以进行更为复杂的检查和操作,具有更精细和更强大的数据控制能力。为实现动态约束以及多个元组之间的完整性约束,就需要触发器技术Trigger。Trigger是一种过程完整性约束(相比之下,CreateTable中定义的都是非过程性约束),是一段程序,该程序可以在特定的时刻被自动触发执行,比如在一次更新操作之前执行,或在更新操作之后执行。

3、触发器经常用于加强数据的完整性约束和业务规则等。触发器创建语法四要素:监视地点(table)、监视事件(insert/update/delete)、触发时间(after/before)、触发事件(insert/update/delete)。

4、触发器的创建者:表的拥有者,即表的创建者;触发器名:同一模式下是唯一的;表名:触发器的目标表;触发事件:INSERT、DELETE、UPDATE,也可以是这些操作的组合。

第7章:数据库设计

1、按规范设计法可将数据库设计分为六个阶段:系统需求分析阶段、概念结构设计阶段、逻辑结构设计阶段、物理设计阶段、数据库实施阶段、数据库运行与维护阶段。

2、数据字典的用途:数据字典是各类数据描述的集合,是进行详细的数据收集和数据分析所获得的主要结果。数据字典在数据库设计中占有很重要的地位。

第10章:数据库恢复技术

1、日志文件与静态转储后备副本配合进行介质故障恢复
静态转储的数据已是一致性的数据。出现介质故障后,1)重装后备副本,恢复到转储结束时的一致性状态2)利用日志文件把已完成的事务重做,对故障发生时尚未完成的事务撤销处理。

2、日志文件与动态转储后备副本配合进行介质故障恢复
动态转储数据库的同时,转储同一时点的日志文件,后备副本与该日志文件结合起来才能将数据库恢复到一致性状态。利用这些日志文件副本进一步恢复事务,避免重新运行事务程序。

3、事务故障的恢复方法与步骤
恢复方法:由恢复子系统利用日志文件撤销(undo)此事务已经对数据库进行的修改,该恢复由系统自动完成,不需要用户干预。
恢复步骤:
1)反向扫描文件日志,查找该事务的更新操作。
2)对该事务的更新操作执行逆操作。即将日志记录中“更新前的值”写入数据库。具体分为:
插入操作:“更新前的值”为空,则做删除操作。删除操作:“新后的值”为空,则做插入操作。修改操作:则用修改前的值代替修改后的值。
3)继续反向扫描日志文件,查找该事务的其他更新操作,并做同样处理。如此处理下去,直至读到此事务的开始标记,事务故障恢复就完成了。

4、系统故障的恢复方法与步骤
系统故障造成数据库不一致状态的原因是:一些未完成事务对数据库的更新已写入数据库;一些已提交事务对数据库的更新还留在缓冲区没来得及写入数据库。
恢复方法:撤销(undo)故障发生时未完成的事务,重做(redo)已完成的事务。
恢复步骤:
1)正向扫描日志文件(即从头扫描日志文件)找到故障发生前已经提交的事务,将其事务标识记入“重做队列”,同时找到故障发生时尚未完成的事务,将其事务表示记入“撤销队列”。
2)反向扫描日志文件,对每个UNDO事务的更新操作执行逆操作,即将“更新前的值”写入数据库。
3)正向扫描日志文件,对Redo队列事务进行REDO处理,即对每个REDO事务重新执行日志文件登记的操作。

5、介质故障的恢复方法与步骤
恢复方法:重装数据库,使数据库恢复到一致性状态,然后重做(REDO)已完成的事务。
恢复步骤:
1)装入最新的数据库后备副本,使数据库恢复到最近一次转储是的一致性状态。对于动态转储的后备副本,还需同时装入自转储开始时刻的日志文件副本,利用恢复系统故障的方法(redo+undo),才能使得数据库恢复到一致性状态。
2)装入相应的日志文件副本(转储结束时刻的日志文件副本),重做已经完成的事务。首先扫描日志文件,找出故障发生时已提交的事务的标识,将其记入重做队列。然后正向扫描日志文件,对重做队列中的所有事务进行重做处理。即将日志记录中“更新后的值”写入数据库。

6、动态维护日志文件
方法:周期性地执行建立检查点、保存数据库状态的操作。即:
1)将当前日志缓冲区中的所有日志记录写入磁盘的日志文件上。2)在日志文件中写入一个检查点记录。3)将当前数据缓冲区的所有数据记录写入磁盘的数据库中。4)把检查点记录在日志文件中的地址写入一个重新开始文件。定期:按照预定的一个时间间隔。不定期:按照某种规则,如日志文件已写满一半建立一个检查点。

7、利用检查点方法进行恢复步骤
1)从重新开始文件中找到最后一个检查点记录在日志文件中的地址,由该地址在日志文件中找到最后一个检查点记录。
2)由该检查点记录得到检查点建立时刻所有正在执行的事务清单ACTIVE-LIST,建立两个事务队列:UNDO-LIST和REDO-LIST。把ACTIVE-LIST暂时放入UNDO-LIST队列,REDO队列暂为空。
3)从检查点开始正向扫描日志文件,直到日志文件结束。如有新开始的事务Ti,把Ti暂时放入UNDO-LIST队列。如有提交的事务Tj,把Tj从UNDO-LIST队列移到REDO-LIST队列。
4)对UNDO-LIST中的每个事务执行UNDO操作,对REDO-LIST中的每个事务执行REDO操作。

8、数据库镜像的作用
DBMS自动把整个数据库或其中的关键数据复制到另一个磁盘上,DBMS自动保证镜像数据与主数据的一致性。
作用:
1)出现介质故障时:DBMS自动利用镜像磁盘数据进行数据库的恢复,不需要关闭系统和重装数据库副本。
2)没有出现故障时:可用于并发操作,即当一个用户对数据加排他锁修改数据时,其他用户可以读镜像数据库上的数据。、

第11章:并发控制

三级封锁协议与两段锁协议的区别:

1、过程不同:三级封锁协议是一步完成封锁的,而后者却要分为两个阶段,耗费时间。2、含义不同:两段锁协议是指每个事务的执行可以分为两个阶段:生长阶段(加锁阶段)和衰退阶段(解锁阶段),三级加锁协议也称为三级封锁协议,是为了保证正确的调度事务的并发操作,事务在对数据库对象加锁,解锁是必须遵守的一种规则.在运用X锁和S锁对数据对象加锁时,还需要约定一些规则。3、功能不同:三级封锁协议除防止了丢失修改和不读“脏”数据外,还进一步防止了不可重复读。后者只是对事务进行时的封锁。

补充:

1、数据库系统主要特点:数据结构化(主要特征,与文件本质区别)、数据共享性高冗余度低且易扩充、数据独立性高、数据由数据库管理系统统一管理和控制。

2、外模式/模式映象用途:保证数据的逻辑独立性
当模式改变时(增加新的关系、新的属性、改变属性的数据类型等),数据库管理员修改有关的外模式/模式映象,可以使外模式保持不变;
应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。

3、模式/内模式映象的用途:保证数据的物理独立性
当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变;
应用程序不受影响,保证了数据与程序的物理独立性,简称数据的物理独立性。

4、相对于非关系模型,关系数据模型的缺点之一是存取路径对用户透明,需进行查询优化。

5、视图是从一个或几个基本表导出的表,它与基本表不同,它是一个虚表,(2分)数据库中只存放视图的定义,而不存放视图对应的数据,这些数据存放在原来的基本表中,当基本表中的数据发生变化,从视图中查询出的数据也就随之改变(2分)。视图一经定义就可以像基本表一样被查询、删除,也可以在一个视图之上再定义新的视图,但是对视图的更新操作有限制(1分)。

6、数据模型是严格定义的概念的集合,通常由三部分组成:数据结构(描述系统的静态特性)、数据操作(描述系统的动态特性)、完整性约束(描述系统中数据的制约和依存规则)。
1)数据结构描述了系统的静态特性
数据结构描述了数据库的组成对象以及对象间的联系,是刻画一个数据模型性质最重要的方面。在数据库系统中,人们通常按照其数据结构的类型来命名数据模型。例如:层次结构、网状结构和关系结构的数据模型,被分别命名为层次模型、网状模型和关系模型。
2)数据操作描述了系统的动态特性
数据操作是对DB中各种对象(型)和实例(值)所允许进行的操作以及操作规则的集合。DB主要包括查询和更新(包括插入、修改和删除)两大类操作。数据模型必须定义这些操作的确切含义、操作符号、操作规则以及实现操作的语言。
3)完整性约束是一组完整性规则
完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则集合,用以限定符合数据模型的DB状态及其变化,以保证数据的正确性、有效性和相容性。数据模型应该反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。

7、参照完整性规则:若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系)(2分),则对于R中每个元组在F上的值必须为:取空值(F的每个属性值均为空值)(1.5分)或者等于S中某个元祖的主码值(1.5分)

8、实体完整性规则:若属性A是基本关系R的主属性,则属性A不能取空值。基本关系的所有主属性不能取空值,而不仅是主码整体不能取空值。
1)实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一个实体集或一个多对多联系。
例如:“学生”关系对应学生实体,“选课”关系对应学生和选修课程之间的多对多联系。
2)现实世界中的实体是可区分的,即它们具有某种唯一性标识。例如,每个学生都是可以区分的独立的个体。相应地,关系模型中以主码作为唯一性标识。
3)主码中的属性(即主属性)不能取空值。
空值就是“不知道”或“无意义”的值。如果主属性取空值,就说明存在某个不可标识的实体,即存在不可区分的实体,这与上一点相矛盾,因此这个规则称为实体完整性。

9、实体完整性检查
用PRIMARY KEY定义了关系的主码之后,每当对基本表插入记录或对码列进行更新操作时,RDBMS按照实体完整性规则自动进行检查。包括:
1)检查主码值是否唯一,如果不唯一则拒绝插入或修改。
2)检查主码的各个属性是否为空,只要有一个为空就拒绝插入或修改。

10、参照完整性检查
1)当参照表中进行插入或者修改外码值操作时,可能破坏被参照表中参照完整性,这时拒绝操作。
2)当被参照表中删除元祖或者修改主码值时,可能破坏参照表中的参照完整性,这时可作出以下处理:拒绝操作(no action)、级联(cascade)删除(修改)、或者设置成空值。

11、数据库设计的六个阶段概述
1)需求分析阶段:需求分析是整个数据库设计过程的基础,要收集数据库所有用户的信息内容和处理要求,并加以规格化和分析。这是最费时、最复杂的一步,但也是最重要的一步,相当于待构建的数据库大厦的地基,它决定了以后各步设计的速度与质量。需求分析做得不好,可能会导致整个数据库设计返工重做。
2)概念结构设计阶段:是整个数据库设计的关键,它通过对用户需求进行综合、归纳与抽象,形成一个独立于具体数据库管理系统的概念模型。
3)逻辑结构设计阶段:将概念结构转换为某个数据库管理系统所支持的数据模型,并对其进行优化。
4)物理结构设计阶段:为逻辑数据模型选取一个最适合应用环境的物理结构,包括存储结构和存取方法。
5)数据库实施阶段:在该阶段,设计人员运用DBMS提供的数据库语言及其宿主语言,根据逻辑设计与物理设计的结果建立数据库,编写相应程序,并进行试运行。
6)数据库运行和维护阶段:在数据库经过试运行后即可投入正式运行。在数据库系统运行过程中必须不断地对其进行评估、调整与修改。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-12-04 13:30:42  更:2021-12-04 13:31:08 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/17 8:56:02-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码