[大数据] centos上搭建运行spark的环境

IT数码购物网址头条软件日历阅读图书馆

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放器↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> centos上搭建运行spark的环境 -> 正文阅读

[大数据]centos上搭建运行spark的环境

由《Spark快速大数据分析》：使用Spark的第一步是下载和解压缩，所以我首先下载并解压了spark-2.4.0-bin-hadoop2.7.tgz。

然后尝试使用Spark中Python的shell。进入Spark目录，然后输入：

bin/pyspark

提示：JAVA_HOME is not set。

我用的是腾讯云服务器，估计默认没有安装JAVA，执行如下命令安装：

yum install -y java-1.8.0-openjdk
yum -y install java-1.8.0-openjdk-devel

java环境安装完成后再次执行bin/pyspark，这次提示：python：未找到命令。

因为spark-2.4是基于python2的，而我这个服务器默认是python3，所以需要把python2也装上：

sudo dnf install python2

然后再把python2设为默认环境就可以了：

接着，书上推荐使用IPython，如下安装：

sudo pip install ipython

启动IPython的命令：

PYSPARK_DRIVER_PYTHON=ipython bin/pyspark

ok，环境搭建完毕。

大数据最新文章

实现Kafka至少消费一次

亚马逊云科技：还在苦于ETL？Zero ETL的时代

初探MapReduce

【SpringBoot框架篇】32.基于注解+redis实现

Elasticsearch：如何减少 Elasticsearch 集

专题五 Redis高并发场景

基于GBase8s和Calcite的多数据源查询

Redis——底层数据结构原理

上一篇文章下一篇文章查看所有文章

加:2022-02-07 13:47:24 更:2022-02-07 13:49:38

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

360图书馆购物三丰科技阅读网日历万年历 2026年4日历

-2026/4/8 1:08:59-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码