IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Spark集群搭建 -> 正文阅读

[大数据]Spark集群搭建

4、Spark集群搭建

4.1. 安装环境

  • 搭建之前确认对应的 java 版本为1.8版本。

  • 搭建之前确认对应的 scala 版本为2.12.x版本。

    • ##三台计算机Node01 Node02 Node03都需要安装Scala
      [root@node01 ~]# rpm -ivh scala-2.12.11.rpm
      [root@node01 ~]# whereis scala    //usr/share/scala
      [root@node01 ~]# vim /etc/profile
      
      export SCALA_HOME=/usr/share/scala
      export PATH=$SCALA_HOME/bin:$PATH
      
      [root@node01 ~]# source /etc/profile
      

4.2. standalone模式

  • 下载上传解压删除安装包

    • [root@node01 ~]# tar -zxvf spark-2.4.6-bin-without-hadoop-scala-2.12.tgz
      [root@node01 ~]# rm -rf spark-2.4.6-bin-without-hadoop-scala-2.12.tgz
      [root@node01 ~]# mv spark-2.4.6-bin-without-hadoop-scala-2.12 spark-2.4.6
      [root@node01 ~]# mv spark-2.4.6 /opt/yjx/
      [root@node01 ~]# cd /opt/yjx/spark-2.4.6/conf
      
  • 修改Spark工作节点

    • [root@node01 conf]# mv slaves.template slaves
      [root@node01 conf]# vim slaves
      
    • node01
      node02
      node03
      关闭# :wq
      
  • 修改Spark环境

    • [root@node01 conf]# mv spark-env.sh.template spark-env.sh
      [root@node01 conf]# vim spark-env.sh
      
    • JAVA_HOME :配置 java_home 路径

      SPARK_MASTER_HOST : master 节点的 ip

      SPARK_MASTER_PORT :提交任务的端口,默认是 7077

      SPARK_WORKER_CORES :每个 worker 从节点能够支配的 core 核的个数

      SPARK_WORKER_MEMORY :每个 worker 从节点能够支配的内存数

    • export JAVA_HOME=/usr/java/jdk1.8.0_231-amd64
      export SPARK_MASTER_HOST=node01
      export SPARK_MASTER_PORT=7077
      export SPARK_WORKER_CORES=2
      export SPARK_WORKER_MEMORY=2g
      export HADOOP_HOME=/opt/yjx/hadoop-3.1.2
      export HADOOP_CONF_DIR=/opt/yjx/hadoop-3.1.2/etc/hadoop
      export SPARK_DIST_CLASSPATH=$(/opt/yjx/hadoop-3.1.2/bin/hadoop classpath)
      
  • 同步到其他节点

    • [root@node01 ~]# scp -r /opt/yjx/spark-2.4.6 root@node02:/opt/yjx/
      [root@node01 ~]# scp -r /opt/yjx/spark-2.4.6 root@node03:/opt/yjx/
      
  • 配置环境变量

    • [123 ~]# vim /etc/profile
      
      export SPARK_HOME=/opt/yjx/spark-2.4.6
      export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin
      
      【123 ~】# source /etc/profile
      
  • 启动集群

    • [root@node01 ~]# cd /opt/yjx/spark-2.4.6/sbin/
      [root@node01 sbin]# ./start-all.sh
      
  • 访问

    • http://192.168.88.101:8080/
    • 在这里插入图片描述
  • Tips

    • 8080Spark WEBUI界面的端口,7077Spark任务提交的端口

    • 如需修改masterWEBUI端口:

      • 修改$SPARK_HOME/sbin/start-master.sh即可

    在这里插入图片描述

  • 运行案例

    • spark-submit --master spark://node01:7077 --class org.apache.spark.examples.SparkPi $SPARK_HOME/examples/jars/sparkexamples_2.12-2.4.6.jar 10
      
  • 关机快照

    • [root@node01 ~]# cd /opt/yjx/spark-2.4.6/sbin/
      [root@node01 sbin]# ./stop-all.sh
      [root@node01 sbin]# shutdown -h now
      

4.3. yarn模式

  • 启动集群前配置和Standalone相同

  • spark-env.sh 文件追加如下内容

    • 在安装standalone模式的时候已经添加。无需再添加,可直接使用。

    • export HADOOP_HOME=/opt/yjx/hadoop-3.1.2
      export HADOOP_CONF_DIR=/opt/yjx/hadoop-3.1.2/etc/hadoop
      
  • 启动集群

#启动Zookeeper:
【123】# zkServer.sh start
#启动Hadoop :
[root@node01 ~]# start-all.sh
#启动Spark:
[root@node01 ~]# cd /opt/yjx/spark-2.4.6/sbin/
[root@node01 sbin]# ./start-all.sh
  • 访问

    • spark: http://192.168.88.101:8080/
    • hdfs: http://192.168.88.101:9870/
    • yarn: http://192.168.88.101:8088
  • 提交任务

  • spark-submit --master yarn --class org.apache.spark.examples.SparkPi $SPARK_HOME/examples/jars/spark-examples_2.12-2.4.6.jar 10
    
  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-09 10:18:18  更:2021-08-09 10:18:27 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/17 17:02:43-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码