IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> MacOS上搭建Spark环境 -> 正文阅读

[大数据]MacOS上搭建Spark环境

安装JDK

没有安装的直接去Oracl官网下载相应的JDK版本安装即可。
安装过JDK,可以使用下面命令查看当前安装了哪些JDK版本。

/usr/libexec/java_home -V

下面是笔者机器上安装的JDK版本,已经当前正在使用的版本。

$ /usr/libexec/java_home -V
Matching Java Virtual Machines (2):
    11.0.14 (x86_64) "Oracle Corporation" - "Java SE 11.0.14" /Library/Java/JavaVirtualMachines/jdk-11.0.14.jdk/Contents/Home
    1.8.0_301 (x86_64) "Oracle Corporation" - "Java SE 8" /Library/Java/JavaVirtualMachines/jdk1.8.0_301.jdk/Contents/Home
/Library/Java/JavaVirtualMachines/jdk-11.0.14.jdk/Contents/Home

ssh免密登录

# 生成没有秘钥的public key,可以使用rsa,也可以使用ed25519
ssh-keygen -t rsa -b 4096 -P '' -f ~/.ssh/id_rsa
ssh-keygen -t ed25519 -P '' -f ~/.ssh/id_ed25519
# 将public key拷贝到authorized_keys
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
# 修改authorized_key的权限
chmod og-wx ~/.ssh/authorized_keys 

Bug1:ssh: connect to host localhost port 22: Connection refused
Solution:选择系统偏好设置->共享->点击远程登录然后再输入命令ssh localhost发现已经解决问题

安装配置Hadoop

可以使用brew install hadoop,也可以直接下载hadoop并解压到指定目录。
brew安装的目录为:/usr/local/Cellar/hadoop/

修改hadoop-env.sh

进入Hadoop的安装目录下的配置目录etc/hadoop,修改hadoop-env.sh的内容。

export HADOOP_OPTS="$HADOOP_OPTS -Djava.net.preferIPv4Stack=true -Djava.security.krb5.realm= -Djava.security.krb5.kdc="
export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk-11.0.14.jdk/Contents/Home
export HADOOP_CONF_DIR=$HOME/hadoop_spark/hadoop-3.2.0/etc/hadoop

配置hdfs地址和端口

修改core-site.xml文件,如下:

<configuration>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>$HOME/hadoop_spark/hadoop-3.2.0/hdfs/tmp</value>
    <description>A base for other temporary directories.</description>
  </property>
  <property>
     <name>fs.default.name</name>
     <value>hdfs://localhost:8020</value>
  </property>
</configuration>

配置MapReduce中jobtracker的地址和端口

找到mapred-site.xml.template文件,将文件重命名为mapred-site.xml,并修改内容。

<configuration>
   <property>
     <name>mapred.job.tracker</name>
     <value>localhost:8021</value>
   </property>
</configuration>

修改hdfs备份数

相同目录下,打开hdfs-site.xml文件,修改内容。

<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
</configuration>

格式化HDFS

初始化文件系统,打开终端输入:hdfs namenode -format
如果出现下面的情况代表成功.
在这里插入图片描述

配置Hadoop环境变量

在.bashrc中添加下面的配置

export HADOOP_HOME=$HOME/hadoop_spark/hadoop-3.2.0
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

启动关闭Hadoop服务

# 启动HDSF服务
./start-dfs.sh  
# 关闭HDSF服务
./stop-dfs.sh

安装Scala

可以直接使用brew install scala安装,并修改环境变量。

export SCALA_HOME=/usr/local/Cellar/scala/2.13.8
export PATH=$PATH:$SCALA_HOME/bin

安装Spark

直接从官网下载相应版本,解压到本地目录,并配置系统变量。下面是完整的配置:

export HADOOP_HOME=$HOME/hadoop_spark/hadoop-3.2.0
export SPARK_HOME=$HOME/hadoop_spark/spark-3.2.1-bin-hadoop3.2
export SCALA_HOME=/usr/local/Cellar/scala/2.13.8
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$SCALA_HOME/bin:$SPARK_HOME/bin:$SPARK_HOME/sbin:$PATH

使用Spark

在终端,使用spark-shell启动:
在这里插入图片描述
使用pyspark启动:
在这里插入图片描述
使用浏览器访问:http://localhost:4040/

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-05-18 17:42:19  更:2022-05-18 17:43:11 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/16 5:59:07-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码