IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> CMU15-455 Buffer Pools - BPM -> 正文阅读

[大数据]CMU15-455 Buffer Pools - BPM

Buffer Pools

1 Locks vs. Latches

在讨论 DBMS 如何保护其内部元素时,我们需要区分 lock 和 latches。

锁 lock

  • 保护数据库逻辑内容(例如,元组、表、数据库)免受其他事务的影响。
  • 在交易期间持有。
  • 需要能够回滚更改。

锁存器 latches 类似操作系统的mutex

  • 保护 DBMS 内部数据结构的关键部分免受其他线程的影响。
  • 在操作期间保持。
  • 不需要能够回滚更改。

2 缓冲池 Buffer Pool

BPM的总体架构

与虚拟内存的设计思想一致,BPM核心的便是将内存中的地址映射到磁盘中的地址(再次通过增加一个中间层解决了问题),向上提供所有数据都装入内存的幻象,数据单位为页。为了区分内存中的页和磁盘中的页,我们做一个定义:

  • frame:buffer中的一页
  • page:磁盘中的一页

BPM结构如下图所示:

img

其中包含两个数据结构:

  • Buffer Pool:里面包含了一些frame,而这些frame中保存的就是对应page的内容
  • Page Table:保存的是 page id -> frame id的映射。

实际运行的流程如下:

  1. 上层任务向BPM请求一个page

  2. BPM查询对应的page是否在buffer pool中,即Page Table中包不包含page id

    1. 如果包含,那么返回对应的frame地址,并将frame 的pin count加1(代表这个frame的引用多了一次)
    2. 如果不包含,BPM需要将Page读如Buffer Pool中的frame中,再返回对应的frame地址(这其中可能包含置换)
  3. 结束

缓冲池是从磁盘读取的页面的内存缓存。 DBMS 总是知道得更好,所以我们想自己管理内存和页面。

它是组织为固定大小页面数组的内存区域。每个数组条目称为一个框架。当DBMS 请求一个页面,一个精确的副本被放置在这些框架之一。

缓冲池维护的元数据:

  • 页表:内存中的哈希表,用于跟踪当前内存中的页面。它映射
    页 id 到缓冲池中的帧位置。
  • 脏标志:线程在修改页面时设置此标志。这向存储管理员表明
    页必须写回磁盘。
  • Pin 计数器(引用计数):这会跟踪当前访问该页面的线程数(无论是阅读
    或修改它)。线程必须在访问页面之前增加计数器。如果一个页面的计数
    大于零,则不允许存储管理器从内存中驱逐该页面。

优化:

  • 多个缓冲池:DBMS 也可以有多个缓冲池用于不同的目的。这个
    有助于减少闩锁争用并改善局部性
  • 预取:DBMS 还可以根据查询计划通过预取页面进行优化。通常
    按顺序访问页面时完成。
  • 扫描共享:查询光标可以附加到其他光标并一起扫描页面。

分配政策:

  • 全局策略:DBMS 应如何为所有活动的 txns 做出决策。
  • 本地策略:将帧分配给特定的 txn,而不考虑并发 txns 的行为。

3 更换政策

替换策略是 DBMS 实现的一种算法,它决定当需要空间时从缓冲池中驱逐将哪些页面。

实施目标:

  • 正确性
  • 准确性
  • 速度
  • 元数据开销

Least Recently Used 最近最少使用 (LRU)

  • 维护每个页面上次访问时间的时间戳。
  • DBMS 选择驱逐具有最早时间戳的页面。

CLOCK
LRU 的近似值,不需要每页单独的时间戳。

  • 每个页面都有一个引用位
  • 访问页面时,设置为 1

使用“时钟指针”在循环缓冲区中组织页面

  • 扫描时检查页面位是否设置为 1
  • 如果是,则设置为零,如果不是,则驱逐
  • 时钟指针会记住驱逐之间的位置

备选方案
LRU 和时钟替换策略的问题:

  • LRU 和 Clock 容易受到顺序泛滥的影响,其中缓冲池的内容被丢弃
    由于顺序扫描。
  • 由于不跟踪页面使用方式的元数据,LRU 页面可能实际上很重要。

更好的解决方案:

  • LRU-K:考虑最近 K 个引用的历史记录,不看最老的时间戳,而是看这些时间戳的间隔,间隔最长的会被丢弃
  • 优先级提示:允许 txns 告诉缓冲池页面是否重要
  • 本地化:基于每个交易/查询选择要驱逐的页面

Transactions (事务)可以缩写为 TXNS

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-09-29 10:21:27  更:2021-09-29 10:23:22 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 20:35:36-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码