IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Hadoop伪分布式部署(Linux) -> 正文阅读

[大数据]Hadoop伪分布式部署(Linux)


*
Hadoop分布式系统基础框架具有创造性和极大的扩展性,用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的高速运算和存储。
Hadoop的核心组成部分是HDFS,MapReduce以及Common,其中HDFS提供了海量数据的存储,MapReduce提供了对数据的计算,Common为其他模块提供了一系列文件系统和通用文件包。
*

部署前需要配置Java环境(已经配置可以跳过)

1.解压jdk

tar -zxvf jdk-8u121-linux-x64.tar.gz

2.配置环境变量

vim /etc/profile

然后添加:(根据自己的jdk版本进行调整)
在这里插入图片描述
使配置生效:

source /etc/profile

3.检查是否配置成功

java -version

在这里插入图片描述

Hadoop安装配置

我这里使用的版本是2.7.2

1.解压Hadoop

在这里插入图片描述

2.配置Hadoop

在 /etc/profile文件中添加:
在这里插入图片描述

配置使其生效

source /etc/profile

检验是否成功(在终端输入hadoop)
在这里插入图片描述

3.分别配置并修改以下文件:

1)在第二十五行修改代码
**vim **
在这里插入图片描述

2)
在这里插入图片描述
在这里插入图片描述
3)
在这里插入图片描述
在这里插入图片描述
4)
在这里插入图片描述
在这里插入图片描述

修改完后将其重命名:
在这里插入图片描述
5)
在这里插入图片描述
在这里插入图片描述

4.生成秘钥,使得ssh服务免密连接localhost

格式化,终端输入:

1| hdfs namenode -format

在这里插入图片描述
启动,终端输入(一路输入yes):

2| start-all.sh

在这里插入图片描述
启动完成后,检查集群:

jps

在这里插入图片描述
Web控制台访问:http://192.168.27.133:50070、http://192.168.27.133:8088
上传HDFS

hdfs dfs -put in.txt /adir 上传本地路径下的in.txt文件到hdfs的/adir目录下

运行wordcount:

hadoop jar /home/lingan/hadoop-2.7.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /data/wordcount /output/wordcount

然后在http://192.168.27.133:50070中查看/usr/root/output/part-r-00000文件里的词频统计结果。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-16 11:48:52  更:2021-08-16 11:51:13 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 13:16:49-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码