IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> HIVE学习系列——windows Hadoop安装(上) -> 正文阅读

[大数据]HIVE学习系列——windows Hadoop安装(上)


整体流程概览

系统:windows10
Jre8 => hadoop安装与配置 => HDFS格式化 => 开启服务
前排提示,HIVE整体配置篇幅较长,可收藏后慢慢操作。
大佬们有相关编写建议也可以多多指导!


jre环境

jre安装

Jre8官网

  1. 打开官网,选择windows64位的安装包即可

在这里插入图片描述
Orcal官网的下载需要账号登陆,邮箱注册即可,全程无收费点。

  1. 按照提示直接安装

在这里插入图片描述
这里位置可以自定义一下,安装位置要牢记
在这里插入图片描述

  1. 安装过程中可能会提示程序占用,并给出PIDCtrl+Alt+Delete调出任务管理器,先后选择性能资源监视器

在这里插入图片描述

  1. 在资源监视器中搜索PID,找到相应进程后右击,选择结束进程即可(点击PID排序后更好找一些,CPU中找不到时切换至内存、磁盘即可)

在这里插入图片描述

  1. 处理掉占用的进程后会再选一次安装位置,这里个人原因,选择安装在了指定目录下

在这里插入图片描述
文件夹jre为步骤2中选择的位置,文件夹java为第二次选择的位置


jre环境变量配置

  1. 右击此电脑选择属性,在右边找到高级系统设置

在这里插入图片描述

  1. 依次点击环境变量新建,输入变量名JAVA_HOME,点击浏览目录,选择jre安装的位置

在这里插入图片描述

  1. 点击环境变量,在系统变量中找到Path并双击,点击新建,输入%JAVA_HOME%\bin

在这里插入图片描述

  1. 测试jre,在cmd中输入java -versionjavac进行测试

在这里插入图片描述


Hadoop安装与配置

官网下载步骤

Hadoop官网

  1. 点击Download,进入下载界面

在这里插入图片描述

  1. 选择Binary download下的最新版本即可
    Source Download表示源代码版,需要编译后使用
    Binary Download表示可执行版,直接解压使用

在这里插入图片描述

  1. 点击该条链接进行压缩包下载,结果如图所示:

在这里插入图片描述

  1. 下载完成后解压到指定目录即可,解压位置要牢记
    这里需要以管理员方式运行
    windows中管理员方式解压文件

清华镜像下载步骤

Hadoop清华镜像

  1. 选择需要的版本

在这里插入图片描述

  1. 选择tar.gz文件

在这里插入图片描述

  1. 下载完成后解压即可,同样需要以管理员身份运行
    windows中管理员方式解压文件

Hadooponwindows下载

Hadooponwindows
提取码:q1p2
原始Hadooponwindows版本可在github中搜索Hadooponwindows得到

  1. 下载后与hadoop压缩包放置于同一目录下

在这里插入图片描述

  1. 解压hadooponwindows
  2. 将hadooponwindows中的bin与etc复制到hadoop目录下(建议提前备份hadoop中的bin与etc文件夹)

在这里插入图片描述


配置系统变量

  1. 右击此电脑选择属性,在右边找到高级系统设置

在这里插入图片描述

  1. 依次点击环境变量``新建,输入变量名HADOOP_HOME点击浏览目录,选择hadoop安装的位置

在这里插入图片描述

  1. 点击环境变量,在系统变量中找到Path并双击,点击新建,输入%HADOOP_HOME%\bin

在这里插入图片描述

  1. 测试hadoop,在cmd中输入hadoop进行测试,发现报错

在这里插入图片描述
文本形式打开对应位置的cmd文件,发现JAVA_HOME配置错误
在这里插入图片描述
修正后重新测试
在这里插入图片描述
问题解决


hadoop初始文件配置

为方便查看,这里先贴上自己hadoop的路径,也就是之前的解压路径
D:\hive\hadoop\hadoop-3.2.3\
该目录下的内容:

在这里插入图片描述

hadoop.dll文件复制

文件路径:D:\hive\hadoop\hadoop-3.2.3\bin\hadoop.dll

在这里插入图片描述

目标路径1:D:\hive\hadoop\hadoop-3.2.3\sbin

在这里插入图片描述

目标路径2:C:\Windows\System32

在这里插入图片描述

配置文件修改

  • 来到hadoop路径D:\hive\hadoop\hadoop-3.2.3\下,创建若干文件夹以及文件:
    文件夹1:D:\hive\hadoop\hadoop-3.2.3\data
    文件夹2:D:\hive\hadoop\hadoop-3.2.3\data\dfs
    文件夹3:D:\hive\hadoop\hadoop-3.2.3\data\dfs\datanode
    文件夹4:D:\hive\hadoop\hadoop-3.2.3\data\dfs\namenode
    在这里插入图片描述
  • 文件修改
    文件1:D:\hive\hadoop\hadoop-3.2.3\etc\hadoop\hdfs-site.xml

在这里插入图片描述

  1. 增加http-address字段
  2. 修正后两个字段中的路径信息为上一步骤中所创建的信息
<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.http-address</name>
        <value>localhost:50070</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/D:/hive/hadoop/hadoop-3.2.3/data/dfs/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/D:/hive/hadoop/hadoop-3.2.3/data/dfs/datanode</value>
    </property>
</configuration>

文件2:D:\hive\hadoop\hadoop-3.2.3\etc\hadoop\mapred-site.xml

在这里插入图片描述
主要是tracker字段的添加

<configuration>
    <property>
       <name>mapreduce.framework.name</name>
       <value>yarn</value>
    </property>
    <property>
       <name>mapred.job.tracker</name>
       <value>hdfs://localhost:9001</value>
    </property>
</configuration>

如果按照本文所述步骤安装至此,只用修改这2个文件即可,修改完不放心的朋友可以和大佬的这篇文章对应一下,感谢大佬指路

格式化HDFS

在cmd中输入hdfs namenode -format

在这里插入图片描述

相关服务开启

以管理员身份运行cmd,切换至D:\hive\hadoop\hadoop-3.2.3\sbin目录下,输入start-all.cmd,随后输入jps查看服务启动情况

  • 目录位置:
    在这里插入图片描述
  • 运行结果:

执行start-all.cmd之后会出现4个新的执行框,其中正确执行的会在窗口标题处增加“- 服务名称”如图中绿色箭头所示,反之如红色箭头所示
在这里插入图片描述
此时查看jps运行结果也不难看出,只有3个服务启动成功(最初只有2个服务可以成功启动,此图为部分修正后的结果)

服务开启过程中遇到的问题

同样先贴上自己hadoop的路径,也就是之前的解压路径
D:\hive\hadoop\hadoop-3.2.3\

  • 问题1:
java.lang.NoClassDefFoundError: org/apache/hadoop/yarn/server/timelineservice/collector/TimelineColl

解决方法:
未找到类定义,感谢大佬指路
D:\hive\hadoop\hadoop-3.2.3\share\hadoop\yarn\timelineservice路径中的hadoop-yarn-server-timelineservice-3.2.3复制到D:\hive\hadoop\hadoop-3.2.3\share\hadoop\yarn即可

在这里插入图片描述

  • 问题2:
org.apache.hadoop.io.nativeio.NativeIO$POSIX...

解决方法:
hadoop.dll版本不匹配,感谢大佬指路
安装时采用了hadoop==3.2.3,但是hadooponwindows中的hadoop版本为2.0,在大佬提示的git中下载hadoop.dll的3.0版本,之后复制到D:\hive\hadoop\hadoop-3.2.3\bin下即可
Github链接

  • 问题3:
Exiting with status 1: java.io.FileNotFoundException: D:\hive\hadoop\hadoop-3.2.3\data\dfs\namenode\current\VERSION (拒绝访问。)

解决方法:
未以管理员方式运行。

开启服务后的验证

  • 切换至D:\hive\hadoop\hadoop-3.2.3\sbin目录下,输入start-all.cmd,随后输入jps查看服务启动情况

在这里插入图片描述
可见所有服务均已正常启动

  • 在Chrome地址栏输入http://localhost:50070查看Hadoop状态

在这里插入图片描述

  • Chrome输入http://localhost:8088查看集群状态

在这里插入图片描述


HIVE学习系列——windows Hadoop安装(下)

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-04-29 12:12:55  更:2022-04-29 12:13:35 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 0:55:26-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码