[大数据] Spark-Submit

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> Spark-Submit -> 正文阅读

[大数据]Spark-Submit

Spark-Submit

Spark基于 Yarn 的提交任务，有两种模式，一种是 client，另一种是 cluster 。

在 standalone 模式下也有 client 和 cluster 两种方式，方式大同小异，在 yarn 下将 ResourceManager 改为 Master ， NodeManager 改为 Worker ，就变成了 standalone 模型。

1. client模式

提交任务的命令是：

./spark-submit    --master yarn      --deploy-mode client --class x.jar
./spark-submit    --master yarn-client --class x.jar

在这里插入图片描述

Yarn-client模式适用于测试，但由于Driver运行在本地，Driver会与yarn集群中的Executor进行大量的通信，会造成客户机网卡流量的大量增加。当通信数据过大时，有可能会造成Driver端内存不足，或者连接超时。

2. Cluster 模型

提交任务的命令是：

./spark-submit    --master yarn      --deploy-mode cluster --class x.jar
./spark-submit    --master yarn-cluster --class x.jar

在这里插入图片描述

Yarn-Cluster主要用于生产环境中，因为Driver运行在Yarn集群中某一台nodeManager中，每次提交任务的Driver所在的机器都是随机的，不会产生某一台机器网卡流量激增的现象，缺点是任务提交后不能看到日志。只能通过yarn查看日志。

大数据最新文章

实现Kafka至少消费一次

亚马逊云科技：还在苦于ETL？Zero ETL的时代

初探MapReduce

【SpringBoot框架篇】32.基于注解+redis实现

Elasticsearch：如何减少 Elasticsearch 集

Go redis操作

Redis面试题

专题五 Redis高并发场景

基于GBase8s和Calcite的多数据源查询

Redis——底层数据结构原理

加:2021-08-01 14:34:51 更:2021-08-01 14:35:31

360图书馆购物三丰科技阅读网日历万年历 2025年9日历

-2025/9/28 13:35:22-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码