IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Hadoop分布式的搭建 -> 正文阅读

[大数据]Hadoop分布式的搭建

Hadoop分布式的搭建

#五一专属|向所有热爱分享的“技术劳动者”致敬#

1. 搭建前提

  1. 多台计算机
  2. 计算机需要安装Java
  3. 网络防火墙关闭
  4. 计算机之间可以连通

1.1 多台计算机的准备

如果要准备多台真的虚拟机,成本太高,我们在此使用虚拟机

但是安装多台虚拟机速度太慢,所以我们选择克隆

如何克隆?

1.2 克隆步骤

  1. 装好一台计算机

  2. 修改配置文件

    1. /etc/sysconfig/network-scripts/ifcfg-eth0
      删除HWADDR
      删除UUID
    2. 修改主机名
      /etc/sysconfig/network
  3. 关机

  4. 在虚拟里创建快照

  5. 在虚拟机里克隆

  6. 开启克隆出来的机器

  7. 修改计算机名

  8. 删除文件
    rm -rf /etc/udev/rules.d/70-persistent-net.rules

  9. 重启

2. 伪分布式搭建

  1. 下载hadoop安装包

  2. 安装hadoop

    在我们这是解压tar -xf hadoop版本号

  3. 配置hadoop的安装路径
    PATH= $ PATH: $ hadoop/bin:$hadoop/sbin

  4. 配置hadoop 配置Java的路径
    文件路径在/hadoop-2.5.6/etc/hadoop/ (因为远程调用时,不会读取本机profile文件)

    (1)hadoop-env.sh
    (2)mapred-evn.sh
    (3)yarn-env.sh

  5. 配置hadoop 配置关于分布式的内容

    core-site.xml

       <!--配置namenode在哪-->
       <property>
           <name>fs.defaultFS</name>
           <value>hdfs://node01:9000</value>
       </property>
       <!--配置hadoop存放数据的临时目录-->
       <property>
           <name>hadoop.tmp.dir</name>
           <value>/var/abc/</value>
       </property>
    

    hdfs-site.xml

     <property>
         <name>dfs.replication</name>
         <value>1</value>
     </property>
     <!--设置secondaryNode在哪个节点-->
     <property>
         <name>dfs.namenode.secondary.http-address</name>
         <value>node01:50090</value>
     </property>
    
  6. 修改slaves文件,设置哪个为datenode节点

  7. 格式化文件系统

    hdfs namenode -format

  8. 启动hdfs系统

    start-dfs.sh

  9. 查看进程
    jps

  10. 在网页验证

    http://ip:50070

  11. 基本操作

    创建目录
    hdfs dfs -mkdir -p /user/root
    上传文件
    hdfs dfs -put 文件名 路径

3 真分布式搭建

  1. 创建免密钥

    ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
    cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
    #把node01的公钥 发送给其它节点
    scp ~/.ssh/id_dsa.pub node2:~/.ssh/node01.pub
    scp ~/.ssh/id_dsa.pub node3:~/.ssh/node01.pub
    scp ~/.ssh/id_dsa.pub node4:~/.ssh/node01.pub
    # 2,3,4节点将公钥追加到authorized_keys 在3台计算机依次执行
    cat /.ssh/node01.pub >>~/.ssh/authorized_keys
    
  2. 修改配置文件

    core-site.xml

       <!--配置namenode在哪-->
       <property>
           <name>fs.defaultFS</name>
           <value>hdfs://node01:9000</value>
       </property>
       <!--配置hadoop存放数据的临时目录-->
       <property>
           <name>hadoop.tmp.dir</name>
           <value>/var/abc/</value>
       </property>
    

    hdfs-site.xml

       <!--设置副本数,不在超过节点数-->
         <property>
             <name>dfs.replication</name>
             <value>1</value>
         </property>
         <!--设置secondaryNode在哪个节点-->
         <property>
             <name>dfs.namenode.secondary.http-address</name>
             <value>node02:50090</value>
         </property>
    
  3. 讲配置好的hadoop文件发给别的计算机

    scp -r hadoop node02:`pwd`
    scp -r hadoop node03:`pwd`
    scp -r hadoop node04:`pwd`
    
  4. 格式化文件系统

    hdfs namenode -format

  5. 启动hdfs系统

    start-dfs.sh

  6. 查看进程
    jps

  7. 在网页验证

    http://ip:50070

  8. 基本操作

    创建目录
    hdfs dfs -mkdir -p /user/root
    上传文件
    hdfs dfs -put 文件名 路径

4. 分布式问题

WARN hdfs.DFSUtil: Namenode for null remains unresolved for ID null. Check your hdfs-site.xml file to ensure namenodes are configured properly.

解决方案:查看core-site.xml里面的fs.defaultFS的值是否正确

每次链接都提示是否确认?
Are you sure you want to continue connecting (yes/no)

解决方案:
修改/etc/ssh/ssh_config

将其中的# StrictHostKeyChecking ask 改成 StrictHostKeyChecking no`

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-05-05 11:25:14  更:2022-05-05 11:28:25 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 0:39:58-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码