Spark搭建
1.停止hadoop集群
#在master上执行
stop-all.sh
2.上传saprk安装包

3.解压至soft目录
#解压
tar -zxvf spark-2.4.5-bin-hadoop2.6.tgz -C /usr/local/soft/

#重命名
mv spark-2.4.5-bin-hadoop2.6 spark-2.4.5

4.配置环境变量
#spark
export SPARK_HOME=/usr/local/soft/spark-2.4.5
export PATH=$SPARK_HOME/bin:$PATH

#刷新
scoure /etc/profile
5.修改配置文件
#重命名spark-env.sh.template文件为spark-env.sh
mv spark-env.sh.template spark-env.sh

vim spark-env.sh
#追加一下内容
export SPARK_MASTER_IP=master
export SPARK_MASTER_PORT=7077
export SPARK_WORKER_CORES=2
export SPARK_WORKER_INSTANCES=1
export SPARK_WORKER_MEMORY=2g
export JAVA_HOME=/usr/local/soft/jdk1.8.0_171

#重命名slaves.template为slaves
mv slaves.template slaves

vim slaves
#追加一下内容
node1
node2

6.同步到从节点
#node1
scp -r spark-2.4.5/ node1:`pwd`
#node2
scp -r spark-2.4.5/ node2:`pwd`
7.启动spark集群
#进入spark的sbin目录
cd /usr/local/soft/spark-2.4.5/sbin/
#启动集群
./start-all.sh

8.查看进程
master

node1

node2

9.spark ui
http://master:8080/

10.测试
#进入jars目录
cd /usr/local/soft/spark-2.4.5/examples/jars

spark-submit --class org.apache.spark.examples.SparkPi --master spark://master:7077 --executor-memory 512m --total-executor-cores 1 spark-examples_2.11-2.4.5.jar 100

|