| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> SparkSQL优化笔记-Web-UI参数详解 -> 正文阅读 |
|
[大数据]SparkSQL优化笔记-Web-UI参数详解 |
1、背景? ? ? ? 公司内部有大量SparkSQL任务,很多任务有数据倾斜或者内存分配不合理的情况,此博客记录下优化脚本过程中出现的一些问题及经验 2、WebUi应用介绍?? ? ? ? ? ?如上图,SparkSQL Web界面可分为如上5个的模块,以下简单介绍下这5个模块 ? ? ? ?? ? ? Jobs:? ? ? ?整个spark应用任务的job整体信息(简单来说就是提交给spark的任务)
? ? ? ? ?? ?? ?? Job Details:? ? ? ? Jobs 中正在运行(Active Stage)的或者已经结束(Completed Stages) 中Description一栏便可看到具体details信息(job对应的具体信息,可以清楚的看到job被划分为几个stage)
? ? ? ? ? ? Stage:? ? ? ? 直接点击Stage栏位,或者从Job Details中点开对应的stage(Stage是每一个job处理过程要分为的几个阶段)
? ? ?? ? Enviroment:? ? ? ? 此选项提供有关Spark应用程序(或SparkContext)中使用的各种属性和环境变量的信息。用户可以通过这个选项卡得到非常有用的各种Spark属性信息,而不用去翻找属性配置文件。此处需要注意的是,如果你的脚本中单独SET某个变量值的话,此处显示的是Submit提交的参数值。此处切记不要混淆(敲黑板) ? ? ?? ? Executor:? ? ? ? Executor提供了关于内存、CPU和其他被Executors使用的资源的信息。这些信息在Executor级别和汇总级别都可以获取到。一方面通过它可以看出来每个excutor是否发生了数据倾斜,另一方面可以具体分析目前的应用是否产生了大量的shuffle,是否可以通过数据的本地性或者减小数据的传输来减少shuffle的数据量。
? ? ?? ? SQL:? ? ? ? 此选项(只有执行了spark SQL查询才会有SQL选项)可以查看SQL执行计划的细节,它提供了SQL查询的DAG以及显示Spark如何优化已执行的SQL查询的查询计划。此步骤可以看到sql的执行顺序情况,包括表是否被广播等。 3、总结? ? ? ? 如果想了解Spark作业如何优化,首先你需要先了解Submit各个参数的作用以及学会如何通过WebUI定位Spark作业的问题,比如数据倾斜等。本文章较详细的介绍了Web界面各个参数的作用(当然了,参考了很多大佬的博客。结尾会把相关文章放进来,大家也可以参考下)后续同专栏会持续推出针对SparkSQL作业优化的相关文章,最后弱弱的吐槽下,CSDN的这个排版真心不会用,码字10分钟,排版俩小时。 参考资料: ????????????????spark入门之spark Driver Web UI_minge_se的博客-CSDN博客 ???????? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/24 4:57:58- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |