[大数据] Hadoop伪分布式部署（Linux）

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> Hadoop伪分布式部署（Linux） -> 正文阅读

[大数据]Hadoop伪分布式部署（Linux）

Hadoop的架构和组成

*
Hadoop分布式系统基础框架具有创造性和极大的扩展性，用户可以在不了解分布式底层细节的情况下，开发分布式程序，充分利用集群的高速运算和存储。
Hadoop的核心组成部分是HDFS，MapReduce以及Common，其中HDFS提供了海量数据的存储，MapReduce提供了对数据的计算，Common为其他模块提供了一系列文件系统和通用文件包。
*

部署前需要配置Java环境（已经配置可以跳过）

1.解压jdk

tar -zxvf jdk-8u121-linux-x64.tar.gz

2.配置环境变量

vim /etc/profile

然后添加：（根据自己的jdk版本进行调整）
在这里插入图片描述
使配置生效：

source /etc/profile

3.检查是否配置成功

java -version

在这里插入图片描述

Hadoop安装配置

我这里使用的版本是2.7.2

1.解压Hadoop

在这里插入图片描述

2.配置Hadoop

在 /etc/profile文件中添加：
在这里插入图片描述

配置使其生效

source /etc/profile

检验是否成功（在终端输入hadoop）
在这里插入图片描述

3.分别配置并修改以下文件：

1）在第二十五行修改代码
**vim **
在这里插入图片描述

2）
在这里插入图片描述

3）

4）

修改完后将其重命名：
在这里插入图片描述
5）

4.生成秘钥，使得ssh服务免密连接localhost

格式化，终端输入：

1| hdfs namenode -format

在这里插入图片描述
启动，终端输入（一路输入yes）：

2| start-all.sh

在这里插入图片描述
启动完成后，检查集群：

jps

在这里插入图片描述
Web控制台访问：http://192.168.27.133:50070、http://192.168.27.133:8088
上传HDFS

hdfs dfs -put in.txt /adir 上传本地路径下的in.txt文件到hdfs的/adir目录下

运行wordcount：

hadoop jar /home/lingan/hadoop-2.7.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /data/wordcount /output/wordcount

然后在http://192.168.27.133:50070中查看/usr/root/output/part-r-00000文件里的词频统计结果。

大数据最新文章

实现Kafka至少消费一次

亚马逊云科技：还在苦于ETL？Zero ETL的时代

初探MapReduce

【SpringBoot框架篇】32.基于注解+redis实现

Elasticsearch：如何减少 Elasticsearch 集

Go redis操作

Redis面试题

专题五 Redis高并发场景

基于GBase8s和Calcite的多数据源查询

Redis——底层数据结构原理

加:2021-08-16 11:48:52 更:2021-08-16 11:51:13

360图书馆购物三丰科技阅读网日历万年历 2025年10日历

-2025/10/17 9:49:11-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码