IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Hadoop伪分布部署 -> 正文阅读

[大数据]Hadoop伪分布部署

Hadoop伪分布部署

温馨提示:配置时候一定要细心!!!

1. 安装jdk、 Hadoop

安装jdk、Hadoop

2.伪分布部署

主要配置文件 :core-site.xml、mapred-site.xml、yarn-site.xml、hdfs-site.xml

文件名属性名属性值含义
core-site.xmlfs.defaultFShdfs://localhost:9000NameNode地址
hadoop.tmp.dir/home/hadoop01/hadoop/tmpHadoop临时工作目录
mapred-site.xmlmapreduce.framework.nameyarn指定mapreduce运行框架
yarn-site.xmlyarn.resourcemanager.hostnameipResourceManager的ip地址
yarn.nodemanager.aux-servicesmapreduce_shuffleNodeManager上运行的附属服务
hdfs-site.xmldfs.replication1副本数
  1. 修改主机名sudo vi /etc/hostname,保存后重启。(根据需要判断是否需要修改主机名)

  2. 映射ip地址及主机名

    sudo vi /etc/hosts添加 本机ip 主机名

      不知道主机名终端输入hostname查看主机名。
    
  3. 免密登录

    • 检查系统是否安装openssh-client和openssh-server:sudo dpkg -l|grep ssh

    • 如果没有,进行安装:sudo apt-get install openssh-clientsudo apt-get install openssh-server(少哪个安装哪个)

    • 安装成功后进行重启ssh服务:sudo /etc/init.d/ssh restart

    • 配置ssh

      1. 生成密钥对:ssh-keygen -t rsa
      2. 追加公钥:ssh-copy-id -i ~/.ssh/id_rsa.pub 主机名
      3. 免密登录:ssh 主机名

    注意:在进行ssh登录时要区分root用户和普通用户

  4. 设置Hadoop配置文件

    etc/hadoop/core-site.xml:

    <configuration>
        <property>
            <name>fs.defaultFS</name>
            <value>hdfs://localhost:9000</value>
        </property>
        <!--临时文件夹(注意文件夹不用存在,格式化后自动生成),默认是在系统的tmp文件夹下,如果不改计算机重启的话可能会丢失-->
        <property>
            <name>hadoop.tmp.dir</name>
      <value>/home/hadoop01/hadoop/tmp</value>
        </property>
    </configuration>
    

    etc/hadoop/hdfs-site.xml:

    <configuration>
        <property>
            <name>dfs.replication</name>
            <value>1</value>
        </property>
    </configuration>
    

    etc/hadoop/yarn-site.xml:

     <configuration>
          <property>
              <name>yarn.nodemanager.aux-services</name>
              <value>mapreduce_shuffle</value>
          </property>
      </configuration>
    

    etc/hadoop/mapred-site.xml:

    <configuration>
        <property>
            <name>mapreduce.framework.name</name>
            <value>yarn</value>
        </property>
    </configuration>
    
  5. 格式化NameNode:hdfs namenode -format

  6. 启动HDFS:start-dfs.sh,查看启动的Java进程:jps 启动HDFS

  7. 启动YARN:start-yarn.sh,查看启动的Java进程:jps启动yarn后

3.通过Web访问Hadoop(注意2.x与3.x端口号不同)

  1. HDFS Web界面:浏览器中输入 http://localhost:9870HDFS Web界面

  2. YARN Web界面:浏览器中输入 http://localhost:8088YARN Web界面

4.常用端口

端口名称Hadoop2.xHadoop3.x
NameNode内部通信端口8020/90008020/9000/9820
NameNode HTTP UI500709870
MapReduce查看执行任务端口80888088
历史服务器通信端口1988819888

5.问题

  • 1. openssh-server安装时,包之间的依赖关系出现问题。

    解决办法:将openssh-client 卸载再重新安装。

  • 2. Hadoop安装版本过高,配置文件时出错。

    解决办法:官网找相应配置:http://www.apache.org/

6.体会

发现好多知识是需要自己探索的。多看,多思考,多操作。操作的时候可能按步骤操作,但往往就是会出错,所以配置这个东西一定一定要细心!!!!如有错误,欢迎指正。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-09-26 10:14:50  更:2021-09-26 10:16:24 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 22:57:08-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码