IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> 在 PyCharm(汉化版)2021搭建Spark -> 正文阅读

[Python知识库]在 PyCharm(汉化版)2021搭建Spark

打开pycharm创建项目,这里安装路径在D盘

打开菜单"工具(Tools) ->?部署(Deployment) ->配置(Configuration)

创建SFTP

步骤:

点左上角的+号选择SFTP?

?取一个服务器名称

去掉仅对此项目可见的勾,如果不去掉代表只有该项目能用。

?如果忘记spark的ip可以在spark环境中输入ifconfig进行查看

进行主机IP、用户名、密码填写,切记这里的填写的都是spark中的。

配置python解析器

选择现有服务器配置?

添加python解析器变量,在同步文件夹中建议在spark中创建一个文件来存放,本地项目路径可以使用默认。?

?

?创建python文件

在python输入下面内容进行测试pycharm搭建spark是否成功,注:下面代码中有个路径需要修改为自己的路径。该路径是存放要处理的txt文件,里面需要编写内容,内容可以随意但里面要加入空格(因为里面split是以空格来切片) 例如:chu xin lai xie bo ke le。

在spark中输入?

cd /usr/local
sudo mkdir datas
sudo vim word.txt

from pyspark import SparkContext
if __name__ == "__main__":
    sc = SparkContext("local","wc")
    rdd = sc.textFile("/usr/local/datas/word.txt").flatMap(lambda x: x.split(" ")).map(lambda x: (x,1)).reduceByKey(lambda x, y: x+y)
    print(rdd.collect())

修改解析器?

?

这里的解析器修改为spark环境中的解析器,不是本地的解析器。?

?

添加环境变量,也就是添加spark中Java的环境变量。?

如果不知道自己spark中的java路径可以在spark中输入

whereis java

?

?在spark中创建word.txt文件并在其中输出内容(内容随意但要加入空格例如:chu xin lai xie bo ke le)这里创建文件在spark的/usr/local/datas/word.txt中,如果在创建中遇到权限问题可以选择给文件赋予权限或者在创建文件命令前加上sudo

赋予权限命名

sudo chmod 777 需要赋予权限的文件路径

pycharm运行结果 (运行前记得启动hadoop)

spark运行结果?

?

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2022-10-22 21:11:19  更:2022-10-22 21:11:21 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 6:49:10-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码