一.spark shell

在spark shell中编写wordcount程序读取本地文件

1、准备数据源（创建目录，创建文件）
在这里插入图片描述
2.代码：

--注意修改文件地址--
sc.textFile("/opt/spark/spark-2.4.4-bin-hadoop2.7/data/word.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).sortBy(_._2,false).collect

在这里插入图片描述

二. 读取hdfs文件

1.在hadoop创建目录和文件

开通VIP 解锁文章

大数据最新文章

实现Kafka至少消费一次

亚马逊云科技：还在苦于ETL？Zero ETL的时代

初探MapReduce

【SpringBoot框架篇】32.基于注解+redis实现

Elasticsearch：如何减少 Elasticsearch 集

Go redis操作

Redis面试题

专题五 Redis高并发场景

基于GBase8s和Calcite的多数据源查询

Redis——底层数据结构原理

加:2022-12-25 11:16:02 更:2022-12-25 11:19:47

360图书馆购物三丰科技阅读网日历万年历 2026年5日历

-2026/5/2 9:51:26-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码

[大数据]3.Spark 操作

目录：

一.spark shell

二. 读取hdfs文件