IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> spark集群配置 -> 正文阅读

[大数据]spark集群配置

目录

1.集群部署规划

2.安装Spark

3.文件配置

4. 分发文件

5.启动集群

6.查看集群


1.集群部署规划

表1-1?集群部署规划

主机名masterslave1slave2
HDFSNameNode

SecondaryNameNode

DataNode

DataNode
YARNNodeManage

ResourceManager

NodeManager

SparkMasterWorkerWorker

2.安装Spark

??????????进入/export/software目录,将spark软件包导入该目录下。解压spark软件包 到/export/servers目录下,并重命名为spark。

[root@master ~]# cd /export/software/
[root@master software]# rz -be
[root@master software]# ls
apache-flume-1.8.0-bin.tar.gz      kafka_2.11-1.0.2.tgz
apache-hive-1.2.1-bin.tar.gz       redis-6.2.1.tar.gz
apache-zookeeper-3.5.9-bin.tar.gz  spark-2.0.0-bin-without-hadoop.tgz
hadoop-2.6.4.tar.gz                sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz
hbase-1.2.0-bin.tar.gz             zeppelin-0.8.2-bin-all.tgz
jdk-8u141-linux-x64.tar.gz
[root@master software]# tar -zxvf spark-2.0.0-bin-without-hadoop.tgz -C /export/servers/
[root@master software]# cd /export/servers/
[root@master servers]# mv spark-2.0.0-bin-without-hadoop spark

3.文件配置

????????配置spark-env.sh。

[root@master servers]# cd spark/
[root@master spark]# cd conf/
[root@master conf]# cp spark-env.sh.template spark-env.sh
[root@master conf]# vi spark-env.sh

? ? ? ? export SPARK_DIST_CLASSPATH=$(/export/servers/hadoop-2.6.4/bin/hadoop classpath)
????????export HADOOP_CONF_DIR=/export/servers/hadoop-2.6.4/etc/hadoop
????????export SPARK_MASTER_IP=192.168.38.128

??????配置slaves文件。

[root@master conf]# vi slaves

?????????slave1

? ? ? ? ?slave2

????????该文件中写入哪个主机名,哪个主机就会存在worker节点。按照集群部署规划,slave1和slave2主机拥有worker,因此写入这两行内容。

????????配置Spark环境变量。将以下内容写入配置文件/etc/profile末尾,并source使之生效。

?????????export SPARK_HOME=/export/servers/spark
? ? ? ? ?export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

? 4. 分发文件

????????将spark远程发送到其他集群

[root@master conf]# cd /export/servers/
[root@master servers]# scp -r /export/servers/spark slave1:/export/servers/
[root@master servers]# scp -r /export/servers/spark slave2:/export/servers/

5.启动集群

首先启动Hadoop集群。(命令省略)

启动Master节点。

[root@master ~]#start-master.sh

启动Slave节点。

[root@master ~]#start-slaves.sh

6.查看集群

????????????????集群进程与集群部署规划一致。

[root@master servers]# jps.sh
**********master**********
2807 Jps
2139 Master
1854 NameNode
**********slave1**********
1600 DataNode
2005 Worker
2470 Jps
1783 NodeManager
1705 SecondaryNameNode
**********slave2**********
1830 NodeManager
2232 Worker
1723 ResourceManager
1597 DataNode
2639 Jps
[root@master servers]#

????????查看Spark页面

???启动成功后,可以通过“host:port”的方式来访问Spark管理页面,例如:http://192.168.38.128:8080?

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-03-22 20:40:57  更:2022-03-22 20:43:41 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 6:41:41-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码