[大数据] HIVE执行计划查看

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> HIVE执行计划查看 -> 正文阅读

[大数据]HIVE执行计划查看

HIVE执行计划查看

关键字EXPLAIN
使用方法：EXPLAIN SELECT ```````(SQL语句)

解释：MapReduce:表示当前任务执行所用的计算机引擎是MapReduce
Map Operator Tree:表示当前描述的Map阶段执行的操作信息。
Reduce Operator Tree:表示当前描述的Reduce阶段的操作信息。
MAP:
TableScan:表示对关键字alias声明的结果集。这里代指表明。
Statistics:表示对当前阶段的统计信息。例如数据行数和数据量，这两个都是预估值。
Filter Operator:表示在之前操作（TableScan）的结果集上进行数据的过滤。
Predicate:表示Filter Operator进行过滤时候使用的谓词，例如 pt_dt = 2020-11-11
Select Operator:表示在之前的结果集上对列进行投影，即列筛选。
Expressions:表示需要投影的列，即筛选的列。
OutputColNames:表示输出的列名。
Group By Operator:表示在之前的结果集上分组聚合。
Aggreations:表示分组聚合使用的算法.例如 count（）。
keys:表示分组的列。
Reduce Output Operator :表示当前描述的是对之前的结果聚合后的输出信息，这里表示Map端聚合后的信息。
key expressions/value expressions:MapReduce计算引擎，在Map阶段和Reduce阶段输出的都是键-值对的形式，这里key expression和 key expression 和 value expression 分别描述的就是Map阶段输出的键（key）和值（value）所用的数据列。key expression指代的就是聚合列。 value expression 指代的就是聚合的函数。
sort order：表示输出是否进行排序，+表示正序，-表示倒序。
Map-Reduce partition columns:表示Map阶段输出到Reduce阶段的分区列。在HIVE-SQL中可以用distribute by 指代分区的列。
Reduce 阶段关键字和Map阶段的含义一样，不同的如下：
compressed:在 File output operator中这个关键词表示文件输出的结果是否进行压缩，FALSE表示不进行输出压缩。
table:表示正在操作的表。
input format/out putformat:分别表示文件输入和输出的文件类型。
serde:表示读取表数据的序列化和反序列化的方式。

Explain extended， explain的扩展，展示更加详细的信息，
抽象语法树（AST）：是SQL转换成Map Reduce或其他计算引擎的任务中的一个过程，在HIVE3.0版本中，AST会从Explain extended 移除，要查看AST需要使用Explain ast.
作业的依赖关系图，即STAGE DEPENDENCIES其内容和explain所展现的一样。
每个作业的详细信息，即STAGE PLAINS。在打印每个作业的详细信息时，explain extend会打印更多的信息，除了explain打印出的内容，还包括每个标的HDFS读取路径，每个HIVE表的配置信息等。

很重要可以查看出表是否被全表扫描：
explain dependency用于描述一段sql需要的数据来源，输出的是一个json格式的数据，里面包含一下两个部分的内容，
input_partitions：描述一段sql依赖的数据来源表分区，里面存储的分区名的列表，格式如下：
{“partitionname”:“库名@表名 @分区列=分区列的值”}
如果整段sql包含的所有表都是是非分区表，则显示为空。
input_table：描述一段sql依赖的数据来源表，里面存储的是HIVE表名的列表格式如下：
{“tablename”:“库名@表名 ”，“tabletype”：表的类型（外部表/内部表）}

大数据最新文章

实现Kafka至少消费一次

亚马逊云科技：还在苦于ETL？Zero ETL的时代

初探MapReduce

【SpringBoot框架篇】32.基于注解+redis实现

Elasticsearch：如何减少 Elasticsearch 集

Go redis操作

Redis面试题

专题五 Redis高并发场景

基于GBase8s和Calcite的多数据源查询

Redis——底层数据结构原理

加:2021-10-12 23:31:26 更:2021-10-12 23:33:58

360图书馆购物三丰科技阅读网日历万年历 2026年5日历

-2026/5/8 13:12:10-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码