IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 2021-08-22 -> 正文阅读

[大数据]2021-08-22

大数据项目设计及实战

第一章

1.系统架构图设计

在这里插入图片描述

2.系统数据流程设计

在这里插入图片描述

3.集群资源规划设计

在这里插入图片描述

第二章 linux环境准备与设置

1.Linux系统常规设置

2.克隆虚拟机并进行相关的配置

3.对集群中的机器进行基本的配置

1.Linux系统常规设置

1、设置ip地址
2、创建用户

adduser lyc
passwd 123456

exit
3、文件中设置主机名

vi /etc/sysconfig/network

4、主机名映射

vi /etc/hosts
IP地址 xyxy11 xyxy12

5、关闭防火墙

systemctl stop firewalld (本次服务关闭)
systemctl disable firewalld(禁用防火墙) 永久

6.root用户下设置无密码用户切换

ls -l /etc/sudoers
vi /etc/sudoers
加一行
lyc ALL=(root)NOPASSWD:ALL

7.验证机器的防火墙是不是关了

service iptables status
service ipables start
service ipables stop
2.克隆虚拟机并进行相关的配置

1.创建我们需要的目录

mkdir /opt/softwares
mkdir /opt/modules
mkdir /opt/tools
mkdir /opt/datas

2.将root用户的目录改变成lyc用户所属的目录

chown -R lyc:lyc /opt/*

3.将JDK安装包通过工具上传到opt/softwares目录下
4.更改文件的权限

chmod u+x /opt/softwares/*

5.安装JDK

tar -zxvf jdk-linux-x64.tar.gz -C /opt/modules/

6.安装JDK-配置Java环境变量

vi etc/profile 进入文件末尾添加数据
export JAVA_HOME=/opt/modules/jdk 1.8.0
export PATH=$PATH:$JAVA_HOME/bin
保存文件

7.修改虚拟机大小
8.修改虚拟机名称

3.对集群中的机器进行基本配置

1.配置IP地址
2.配置IP地址映射

第三章:Hadoop2.x分布式集群部署

1.hadoop2.x版本下载及安装

2.hadoop2.x分布式集群配置

3.分发到各个机器节点

4.HDFS启动集群运行测试

5.YARN集群运行ManReduce程序测试

6.配置集群中主节点到各个机器的SSH无秘钥登录

7.配置集群内机器时间同步(使用Linux ntp进行)

1.hadoop2.x版本下载及安装

官网下载
https://archive.apache.org/dist
http://archive.cloudera.com/cdh5/

2.hadoop2.x分布式集群配置

HDFS分布式部署
hadoop-env.sh
core-site.xml
Hdfs-site.xml
在这里插入图片描述

在这里插入图片描述
slave
在这里插入图片描述
yarn分布式部署
在这里插入图片描述

2.MapReduce部署

mapreduce部署
mapred-env.sh
mapred-site.xml
在这里插入图片描述

3.分发到各个节点
scp -r hadoop-2.5.0/ xyxy129:/opt/modules xyxy130: /opt/modules
scp -r hadoop-2.5.0/ xyxy129:/opt/modules xyxy131: /opt/modules
4.HDFS启动集群运行测试
hdfs namenode -format
启动各个节点机器服务:
Namenode
Datanode
Resourcemanager
Nodemanager

5.YARN集群运行ManReduce程序测试
hadoop jar /usr/tools/hadoop-2.6.5/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar wordcount /input/data.txt /user/root/data/1
6.配置集群中节点到各个机器的SSH无秘钥登录

主机1:
清空.shh目录
主节点NameNode
1)生成一对公钥与秘钥

ssh-keygen -t rsa

2)拷贝公钥到各个机器上

ssh-copy-id xyxy11
ssh-copy-id xyxy12
ssh-copy-id xyxy13

3)测试ssh连接

ssh xyxy11
ssh xyxy12
ssh xyxy13

4)测试HDFS

stop-dfs.sh

yarn ssh无秘钥登录
主机2:
主节点 Resourcemanager
1)生成一对公钥与秘钥

ssh-keygen -t rsa

2)拷贝公钥到各个机器上

ssh-copy-id xyxy11
ssh-copy-id xyxy12
ssh-copy-id xyxy13

3)测试ssh连接

ssh xyxy11
ssh xyxy12
ssh xyxy13

4)测试HDFS

stop-dfs.sh
7.配置集群内机器时间同步(使用Linux ntp进行)

找一代机器作为时间服务器 xyxy11

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-23 16:45:39  更:2021-08-23 16:46:27 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 12:59:21-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码