IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Hadoop学习(环境配置) -> 正文阅读

[大数据]Hadoop学习(环境配置)

一、生态系统的组成

Hadoop Common:0.2版本开始,Hadoop项目的core部分更名为Hadoop common,为其Hadoop其他项目提供了一些常用工具。包括系统配置工具Configuration、远程过程调用RPC、序列化机制和Hadoop抽象文件系统FieSystem等。

Avro: 是一个数据序列化系统。可以将数据结构或者对象转换成便于存储和传输的格式。

??Zookeeper: 是一个分布式的服务框架。可用于处理分布式的一些数据管理问题,如统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。

. HDFS: Hadoop分布式文件系统(Hadoop Distributed File System),是Hadoop体系中数据存储管理的基础。

?MapReduce: 是一种计算模型,用于进行大数据量的计算。

HBase: 是google的BigTable的开源实现,是一个针对结构化数据的可伸缩、高可靠、高性能、分布式和面向列的动态模式数据库。

?Hive: 是建立在Hadoop基础上的数据仓库架构。

Pig: 是对大型数据集进行分析 和评估的平台,数据分析工具。

Mahout: 在Hadoop基础上创建一些可扩展的机器学习领域经典算法的实现。

X-RIME: 开源的社会网络分析工具。

Crossbow: 利用Hadoop集群进行生物计算。

?Chukwa: 开源的数据收集系统。

?Flume: 日志收集系统。

Sqoop: 是SQL-to-Hadoop的缩写,主要是在结构化数据存储与Hadoop之间进行数据交换。

?Oozie: 开源工作流引擎。
?
原文链接:https://blog.csdn.net/gao_xianwei/article/details/84522655

2、ant环境配置

Windows下安装 Ant

首先进入 Ant 的下载界面?http://ant.apache.org/bindownload.cgi,Windows 平台的同学选在下载 .zip 格式的压缩包,目前(2016-10-27)最新的版本是 1.9.7 ,所以我们这里就已这个版本在 Windows 下的安装为教程(在安装 Ant 之前,我们要确保 JDK 已经正确的安装在我们的计算机上面了,因为 Ant 的运行需要依赖 JDK)。

a,下载压缩包

b,解压

解压 .zip文件,并放在某个目录下,例如:放在 D:\Program Files\Apache Software Foundation 目录下,解压后的文件名是 apache-ant-1.9.7

解压之后文件结构:
1、bin:启动和运行Ant的可执行命令。
2、etc:包含一些样式单文件,通常无需理会。
3、lib:包含Ant的核心类库以及编译和运行Ant的第三方类库。
4、manual:Ant工具的相关文档,对学习Ant很有帮助。

c 、设置环境变量

点系统变量—新建

变量名:ANT_HOME

变量值:E:\apache-ant-1.7.0(这个是你的ant存放的路径)

点击确定后双击Path,在最后添加分号?;? (这个东西前面有就别加了)

;%ANT_HOME%\bin

点击确定后双击ClassPath ,

;%ANT_HOME%\lib

验证:? cmd中输入:ant -version

?问题:说明环境配置出错

3、安装cygwin?

到官网上下载:https://cygwin.com/install.html

官网:http://www.cygwin.com/

Cygwin的优点:近乎一致的UNIX/Linux体验、开源免费、安装卸载方便、源码级兼容性、与Windows互操作、多一套可用的API。

安装步骤:

选择组件比较重要,点击右边小三角把default改为install;有几种必须要安装的,如:

* Base组件的全部,操作方法是点击Base后面的Default,变为Install)

* Devel组件下的subversion及其他将来开发需要用到的组件,例如autoconf等,操作方法是展开Devel组件,点击各个小组件前的Keep文字,变为相应的版本号。

* Net组件下的openssh和openssl组件,用于hadoop需要的ssh访问,操作方法同上。

* System组件下的util-linux组件,用于使用一些常用的more等功能进行调试,操作方法同上。

* 其他一些可能用到的组件,我还单独选择了Perl、Python、Ruby、Science等组件。

? 还有:Archive?
? Libs?
? Net?
? DEShells?
? Utils: 包括bzip2等实用工具?

?

?

验证Cygwin是否安装成功

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-10 13:29:13  更:2021-08-10 13:31:47 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/17 17:16:43-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码