IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 1.spark学习(本地模式安装) -> 正文阅读

[大数据]1.spark学习(本地模式安装)

1.spark环境搭建

1.1准备工作

1.JDK(linux安装)
2.ScalaSDK 本机安装wins上安装
3.Spark安装包
spark官网下载地址(官网下载地址)
传送门:阿里云下载
这是我下载好的spark-3.0.0-preview2-bin-hadoop2.7.tgz

1.2原理

在这里插入图片描述

1.3操作

1.把文件上传到到服务器上spark-3.0.0-preview2-bin-hadoop2.7.tgb
2.解压tar -zxvf spark-3.0.0-preview2-bin-hadoop2.7.tgb
在这里插入图片描述
2.更改权限,如果你不是用的root上传的 需要更改权限

chown -R root /opt/spark-3.0.0-preview2-bin-hadoop2.7
-3.0.0-preview2-bin-hadoop2.7

看下这里权限显示root
在这里插入图片描述
名字太长了把名字改成spark
这些是目录下面的一些详解
在这里插入图片描述

1.4 测试

1.启动spark
/spark/bin/spark-shell
在这里插入图片描述
这个是没有java 环境配置jdk
安装jdk

yum -y list java*
yum install -y java-1.8.0-openjdk-devel.x86_64
java -version

然后继续运行

/spark/bin/spark-shell

在这里插入图片描述
2.访问里面的那个4040端口的那个

http://192.168.10.51:4040
如果发现访问不到可能是防火墙开着的我们把防火墙给关掉

启动防火墙
systemctl start firewalld
关闭防火墙
systemctl stop firewalld
查看防火墙状态
systemctl status firewalld

在这里插入图片描述
部署完成
3.执行运行案例去官网里面拿一个案例,把路径换掉
https://spark.apache.org/examples.html
在这里插入图片描述

val textFile = sc.textFile("file:///root/words.txt")
val counts = textFile.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _)
counts.collect

在这里插入图片描述

回到我们刚刚那个网站刷新可以看到任务的流程图
在这里插入图片描述

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-07-28 07:53:02  更:2021-07-28 07:55:26 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/7 3:28:14-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码