并行数据库
共享内存系统
共享磁盘系统
无共享资源系统
最小化共享资源
层次结构
继承上面三者的优缺点
层次结构分成两层,顶层是无共享结构,底层是共享内存或共享磁盘结构
数据划分和并行算法
数据划分
将大规模数据集水平划分到多个磁盘上,通过并行读写,有效的利用更多的磁盘IO
轮转法
适合访问整个关系的查询
轮转法保证了元组在多个磁盘上平均分配,适合扫描整个关系的应用,负载均衡,并行性好,但是点查询和范围查询效率很低
散列法
适合访问部分记录
范围划分法
- 可能导致不同范围数据偏斜大
- 将每个店每年的销售数据划为成独立的数据表是二维范围划分
并行算法
透明性
-
分布式数据库最基本特征是本地自治、非集中式管理及高可用性。 -
位置独立性、数据分片独立性和数据复制独立性是使分布式数据库具有分布式透明性的主要因素。 -
三种级别从高到低的排序是:分片透明性、位置透明性、局部透明性。
分片透明
分片透明性是指数据分片是用户无需考虑的,完全透明的,在编写程序时用户只需要对全局关系进行操作,是最高级别的透明性;
位置透明
位置透明性是指数据分片的分配位置对用户是透明的,用户编写程序时只需要考虑数据分片情况;
局部数据透明
局部数据模型透明性,使用户在编写程序时不但要了解全局数据的分片情况,还要了解各片断的副本复制情况及各片断和它们副本的场地位置分配情况。
XML数据库
与传统数据库相比,XML数据库具有以下优势:
(1)XML数据库能够对半结构化数据进行有效的存取和管理。如网页内容就是一种半结构化数据,而传统的关系数据库对于类似网页内容这类半结构化数据无法进行有效的管理。
(2)提供对标签和路径的操作。传统数据库语言允许对数据元素的值进行操作,但不能对元素名称进行操作,半结构化数据库提供了对标签名称的操作,包括对路径的操作。
(3)当数据本身具有层次特征时,由于XML数据格式能够清晰表达数据的层次特征,因此XML数据库便于对层次化的数据进行操作。XML数据库适合管理复杂数据结构的数据集。
现阶段在现实环境中,一边使用的是原有的关系数据库厂商在其传统商业产品中进行了相关的扩充,使其能够处理XML数据的产品。
BigTable
|