IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Postgresql源码(63)查询执行——子模块Executor(1) -> 正文阅读

[大数据]Postgresql源码(63)查询执行——子模块Executor(1)

相关
《Postgresql源码(61)查询执行——最外层Portal模块》
《Postgresql源码(62)查询执行——子模块ProcessUtility》
《Postgresql源码(63)查询执行——子模块Executor(1)》

因为时间关系Executor分析拆成几篇,这是第一篇。

1 查询执行整体

PG中的SQL在经过语法解析、查询编译后,进入执行模块,整形模块的分三个子模块:

入口:portal子模块(下图蓝色)
处理DML的Executor子模块(下图绿色)
处理DDL的ProcessUtility子模块(下图橙色)

在这里插入图片描述

SQL会在查询编译阶段得到plantree_list,在portal模块启动时(函数PortalStart),根据plantree_list中具体情况(函数ChoosePortalStrategy),来决定PortalStrategy的值,后面执行根据PortalStrategy来决定进入Executor还是ProcessUtility。

本篇重点分析Executor子模块。

2 分析案例

测试SQL

drop table course;drop table teacher;drop table teach_course;
create table course(no serial, name varchar, credit int,primary key(no));
insert into course(name, credit) values('Natural', 50);
insert into course(name, credit) values('Math', 30);
insert into course(name, credit) values('Database System', 20);

create table teacher(no serial, name varchar, sex char(1), age int);
insert into teacher(name, sex, age) values('Jack', 'm', 33);
insert into teacher(name, sex, age) values('Jennifer', 'f', 30);

create table teach_course(tno int, cno int, stu_num int);
insert into teach_course(tno, cno, stu_num) values(1, 2, 60);
insert into teach_course(tno, cno, stu_num) values(2, 3, 50);



select t.name, c.name, stu_num
from course as c, teach_course as tc, teacher as t
where c.no = tc.cno and tc.tno = t.no and c.name = 'Database System' and t.name = 'Jennifer';

执行计划

explain select t.name, c.name, stu_num
from course as c, teach_course as tc, teacher as t
where c.no = tc.cno and tc.tno = t.no and c.name = 'Database System' and t.name = 'Jennifer';
                                    QUERY PLAN                                     
-----------------------------------------------------------------------------------
 Nested Loop  (cost=24.10..74.58 rows=1 width=68)
   ->  Hash Join  (cost=23.95..62.61 rows=61 width=40)
         Hash Cond: (tc.tno = t.no)
         ->  Seq Scan on teach_course tc  (cost=0.00..30.40 rows=2040 width=12)
         ->  Hash  (cost=23.88..23.88 rows=6 width=36)
               ->  Seq Scan on teacher t  (cost=0.00..23.88 rows=6 width=36)
                     Filter: ((name)::text = 'Jennifer'::text)
   ->  Index Scan using course_pkey on course c  (cost=0.15..0.20 rows=1 width=36)
         Index Cond: (no = tc.cno)
         Filter: ((name)::text = 'Database System'::text)

3 Portal驱动Executor

Executor执行由完成Portal模块拉动,核心函数:

  • ExecutorStart:初始化,构造运行状态存储结构estate
  • ExecutorRun:执行,调用ExecInitNode(函数)、ExecProcNode(函数指针)、ExecEndNode(函数)
  • ExecutorEnd:清理

需要的全部数据全部封装在QueryDesc中,包括计划树。
在这里插入图片描述

4 Executor驱动ExecProcNode

我们先看下执行计划和下图中的node树:

                                    QUERY PLAN                                     
-----------------------------------------------------------------------------------
 Nested Loop  (cost=24.10..74.58 rows=1 width=68)
   ->  Hash Join  (cost=23.95..62.61 rows=61 width=40)
         Hash Cond: (tc.tno = t.no)
         ->  Seq Scan on teach_course tc  (cost=0.00..30.40 rows=2040 width=12)
         ->  Hash  (cost=23.88..23.88 rows=6 width=36)
               ->  Seq Scan on teacher t  (cost=0.00..23.88 rows=6 width=36)
                     Filter: ((name)::text = 'Jennifer'::text)
   ->  Index Scan using course_pkey on course c  (cost=0.15..0.20 rows=1 width=36)
         Index Cond: (no = tc.cno)
         Filter: ((name)::text = 'Database System'::text)

请添加图片描述

  • Executor执行时,在ExecutePlan内循环调用ExecProcNode,每一次拿出来一行元组,直到拿到所有所需元组位置。
  • ExecProcNode每次调用时:
    • 【1】首先拉动语法树根节点:例如上面例子中,会先执行ExecNestLoop,在执行ExecNestLoop时,该节点因为缺数据无法循环嵌套链接,所以肯定要拉动outter plan(hash join)和inner plan(index scan)把需要循环嵌套连接的两个数据拿回来,才能执行连接。
    • 【2】然后hash join在执行时,又会拉动seqscan节点去扫描拿到元组。
  • 所以就是这样由根节点驱动,逐层返回数据,最终拼出一条结果返回给ExecProcNode,ExecProcNode拿到一条结果后,ExecutePlan继续循环调用ExecutePlan拿到后面的结果。

5 总结

我们发现PG执行计划每个节点都是由两个子节点返回数据的(实际上计划树的每个node都是0-2进1出的结构)。在拿到一条执行计划后,直观上可以理解为上层节点(Nested Loop)首先执行,执行是通过自己的两个子节点(Hash Join、Index Scan)拿到数据,子节点又通过自己的子节点拿到数据。这样层层驱动整个计划树的运行。

                                    QUERY PLAN                                     
-----------------------------------------------------------------------------------
 Nested Loop  (cost=24.10..74.58 rows=1 width=68)
   ->  Hash Join  (cost=23.95..62.61 rows=61 width=40)
         Hash Cond: (tc.tno = t.no)
         ->  Seq Scan on teach_course tc  (cost=0.00..30.40 rows=2040 width=12)
         ->  Hash  (cost=23.88..23.88 rows=6 width=36)
               ->  Seq Scan on teacher t  (cost=0.00..23.88 rows=6 width=36)
                     Filter: ((name)::text = 'Jennifer'::text)
   ->  Index Scan using course_pkey on course c  (cost=0.15..0.20 rows=1 width=36)
         Index Cond: (no = tc.cno)
         Filter: ((name)::text = 'Database System'::text)

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-07-17 16:30:00  更:2022-07-17 16:33:15 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/16 1:54:16-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码