| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> Hadoop学习笔记: 入门(1) -> 正文阅读 |
|
[大数据]Hadoop学习笔记: 入门(1) |
*学习过程中使用VMware进行多台服务器的搭建, 全程在一台主机上进行 一. Hadoop运行环境搭建 配置环境变量(JAVA, Hadoop) 为何需要配置环境变量?
配置环境变量步骤解析: 1. 在/etc/profile.d目录下新建环境变量文件mh_env.sh. 设定环境变量JAVA_HOME, 此变量的值为JDK的安装目录. 本次安装路径如下:
2. 将JAVA_HOME加入到系统内置PATH变量中, 加入/bin是因为bin目录储存的是大部分的执行程序.?
3. 环境变量配置完成后, 需要利用source命令让新的环境变量PATH生效
4. 配置Hadoop环境变量时, 则需要再额外添加/sbin目录, 因为Hadoop的执行程序储存在/bin目录和/sbin目录中. 配置完成后, 同样需要对/etc/profile进行source操作使环境变量生效
二.?Hadoop运行模式 Hadoop运行模式包括本地模式, 伪分布式以及完全分布式 ? ? ? ? 本地模式:?单机运行. 生产环境下不适用 ????????伪分布式:?单机运行, 但是具备Hadoop集群的所有功能, 一台服务器模拟一个分布式的环境.? ? ? ? ? ? ? ? ? ? ? ? ? ????一般用于测试 ????????完全分布式:?多台服务器组成分布式环境. 生产环境下最常使用 三. 修改主机名称, 主机名称映射IP 在根目录下/etc/hostname文件中, 可修改当前主机名称. 修改完成后, 打开/etc/hosts, 可对主机名称与IP地址建立一对一的映射关系
四. 集群分发脚本sxync解析 scp(secure copy)安全拷贝 scp可以实现服务器与服务器之间的数据拷贝
rsync 远程同步工具 rsync主要用于备份和镜像, 具有速度快, 避免复制相同内容和支持符号链接的优点. rsync和scp相比, 因为rsync只需要对比两端文件差异并进行更新, 因此速度要比scp更快.
? ?其中的两项参数, -a表示归档拷贝, 也即以递归方式传输文件, -v表示显示复制过程 xsync集群分发脚本 在/home/$user/bin目录下创建xsync文件
?随后将脚本复制到/bin中, 以全局调用
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/24 7:16:01- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |