[大数据] 在hadoop中伪分布式部署的命令与步骤

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> 在hadoop中伪分布式部署的命令与步骤 -> 正文阅读

[大数据]在hadoop中伪分布式部署的命令与步骤

HDFS是进行存储的，YARN是进行调度的。

第一步先切换到hadoop下面的etc（配置文件都在etc下面）

命令：cd /etc

然后在hadoop中配置core-site.xml

命令：Vi core-site.xml? 进入后把下面的代码粘贴进去?

指定HDFS中namenode的地址。将命令放到configuration标签中

<name>fs.defaultFS</name>

????<value>hdfs://hadoop100:9820</value>

</property>

????????<name>hadoop.tmp.dir</name>

????????<value>/opt/module/hadoop-3.1.3/data/tmp</value>

</property>

</configuration>

第二步：在hadoop中配置hdfs-site.xml

命令：vi hdfs-site.xml? ?下面的是代码

在configuration中指定HDFS的数量

????????<name>dfs.replication</name>

????????<value>1</value>

</property>

</configuration>

第四步：格式化NameNode（第一次启动时格式化，以后就不要总格式化）

格式化命令：hdfs namenode –format

第六步：启动namenode ?????????

命令：hdfs ?- -daemon ?start ?namenode

第七步：启动datanode

命令：hdfs ?--daemon start datanode

第八步：配置yarn-site.xml

命令：vi yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.resourcemanager.hostname</name>

<value>hadoop100</value>

</property>

?<property>

??<name>yarn.nodemanager.env-whitelist</name> ???????<value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>

?</property>

</configuration>

第九步：配置mapred-site.xml

命令：[root@hadoop100 hadoop]# vi mapred-site.xml

????????????????<name>mapreduce.framework.name</name>

????????????????<value>yarn</value>

</property>

</configuration>

第十步：启动resourcemanager

命令：[root@hadoop100 hadoop]# yarn --daemon start resourcemanager

十一步：启动nodemanager

命令：[root@hadoop100 hadoop]# yarn --daemon start nodemanager

十二步：Jsp查看java进程

命令：jsp

十三步：在HDFS中创建文件夹/user/input

命令：hdfs dfs -mkdir -p /user/input

十四步：将文件上传到HDFS

命令：hdfs ?dfs ?–put 要上传的文件名上传的地址

案例:?hdfs??dfs??-put??wcinput/wc.input???/user/input/

十五步：查看hdfs的文件目录

命令：Hdfs dfs –ls 文件路径 ??

注意，这里面的根目录不是linux的根目录

案例：hdfs dfs -ls /user/input/

十六步：查看hdfs中文件内容

命令：hdfs dfs –cat?文件名

案例：hdfs dfs -cat /user/input/wc.inpu

最后执行文件

命令：hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar?wordcount?

大数据最新文章

实现Kafka至少消费一次

亚马逊云科技：还在苦于ETL？Zero ETL的时代

初探MapReduce

【SpringBoot框架篇】32.基于注解+redis实现

Elasticsearch：如何减少 Elasticsearch 集

Go redis操作

Redis面试题

专题五 Redis高并发场景

基于GBase8s和Calcite的多数据源查询

Redis——底层数据结构原理

加:2021-12-15 18:21:59 更:2021-12-15 18:22:35

360图书馆购物三丰科技阅读网日历万年历 2026年5日历

-2026/5/4 7:08:45-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码