| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> .NET for Apache Spark 适合.net 6.0 Windows -> 正文阅读 |
|
[大数据].NET for Apache Spark 适合.net 6.0 Windows |
步骤1:可从命令行环境运行 步骤2:下载并安装 .NET SDK ,本文安装.net6.0 步骤3:安装java JDK 步骤4:下载并安装 Apache Spark,本文为spark-3.0.1-bin-hadoop2.7.tgz,下载地址https://archive.apache.org/dist/spark/spark-3.0.1/ ? ? ? ? ? ? ? 配置Apache Spark环境变量 HADOOP_HOME C:\bin\spark-3.0.1-bin-hadoop2.7\ SPARK_HOME C:\bin\spark-3.0.1-bin-hadoop2.7\? PATH "%PATH%;%HADOOP_HOME%;%SPARK_HOME%bin" 配置好后,CMD进入命令行 spark-submit --version ?步骤5:安装 .NET for Apache Spark 下载地址,选择图中的版本下载 https://github.com/dotnet/spark/releases 解压后提取到 C:\bin目录。 步骤6:安装 WinUtils.exe 将 下载好的WinUtils.exe 复制到 C:\bin\spark-3.0.1-bin-hadoop2.7\bin目录中。注意版本号要与hadoop的一致 最后,仔细检查是否可从命令行运行? ?步骤7:cmd命令行,输入如下命令 dotnet new console -o MySparkApp cd MySparkApp dotnet add package Microsoft.Spark 步骤8:在 Visual Studio Code 中打开 Program.cs 或打开任何文本编辑器,再将所有代码替换为以下内容:
步骤9:在 MySparkApp 目录中创建一个名为 input.txt 的文件,其中包含以下文本: 然后执行
dotnet build 最后在MySparkApp根目录执行如下命令: spark-submit --class org.apache.spark.deploy.dotnet.DotnetRunner --master local bin\Debug\net6.0\microsoft-spark-3-0_2.12-2.1.0.jar dotnet bin\Debug\net6.0\MySparkApp.dll input.txt 然后浏览器持续刷新页面http://localhost:4040/jobs/? ? ? 可查看spark的运行过程。 执行成功后,会在控制台打印出如下。 ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/24 10:49:27- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |