IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Windows下PyCharm远程连接Spark -> 正文阅读

[大数据]Windows下PyCharm远程连接Spark

我这里的spark部署在虚拟机内,使用的版本为:

	python3.8
	hadoop3.3
	spark3.2
	java8

为了防止报错,在windows环境我也安装了python3.8和虚拟机同步
此时linux集群已经部署好了spark环境

1、配置Hadoop DLL

在编写spark时可能会用到hadoop的一些功能,所以需要配置hadoop的运行环境

文件可以在github上下载,https://github.com/cdarlint/winutils

因为没有对应的hadoop版本,我用的是对应hadoop3.1的文件,目前没有发现问题

在这里插入图片描述
下载完成后将bin目录的hadoop.dll文件复制进C盘的System32下
在这里插入图片描述

配置完成后,需要加上环境变量

变量名为HADOOP_HOME
变量值为 apache-hadoop-3.1.1-winutils-master文件的位置

在这里插入图片描述

2、下载pyspark库

本机的python版本最好和虚拟机保持一致,以免出现问题
可以使用anaconda创建虚拟环境

pip install pyspark

3、配置pycharm

3.1新建python工程,配置解释器

解释器选择之前创建的虚拟环境下的python.exe在这里插入图片描述

3.2远程连接linux的python解释器

点击pycharm左上角的File -> Settings,找到Python Interpreter
点击右上角的齿轮,选择add增加解释器
在这里插入图片描述

进入后选择SSH,填入主机名和用户名,点击next

因为linux我使用的也是anaconda安装python,且anaconda的所有者是用户user,所以我这里填的是user
在这里插入图片描述
然后填入登录密码在这里插入图片描述

然后填入linux下的python的位置,点击finish

在这里插入图片描述

完成后可以在pycharm的右下角选择解释器
在这里插入图片描述

4、一些环境变量

为了确保spark在运行时少出现问题,需要在windows配置一些环境变量

因为Spark程序是运行在JVM基础之上的,所以需要配置JAVA_HOME
在这里插入图片描述

PYSPARK_PYTHON指向python的解释器,这是为了本地模式能运行spark程序
在这里插入图片描述

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-03-04 15:39:43  更:2022-03-04 15:40:43 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 10:28:52-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码