IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> CDH6.3.2及hadoop生态圈工具安装指南 -> 正文阅读

[大数据]CDH6.3.2及hadoop生态圈工具安装指南

一、前期准备

1.1 软硬件要求

服务器3台,系统要求Centos7

1.2 服务器部署规划

内存磁盘CPUcmcdhMysqlHiveImpalaKuduFlinkSparkKafka
node-01servernamenode
node-02agentdatanode
node-03agentdatanode

1.3 端口规划

服务名称端口号
cloudera manager7180
resourcemanager8088
hue8888
namennode50070
spark19888
kafka9092
mysql3306
hive10000
hbase60030
zookeeper2181

4.数据存储格式及压缩规划

orc列式存储+snappy压缩

5.关闭tuned

systemctl stop tuned
systemctl disable tuned
systemctl status tuned

二、集群环境配置

1.修改主机名

#在不同主机执行不同命令
hostnamectl set-hostname node-01
hostnamectl set-hostname node-02
hostnamectl set-hostname node-03

2.关闭防火墙

方法一:
service iptables stop   #关闭防火墙 
chkconfig iptables off  #禁止开机启动
方法二:
systemctl disable firewalld
systemctl status firewalld

3.关闭selinux

vim /etc/selinux/config
#找到这个改为关闭
selinux=disabled

4.更改文件句柄

vim /etc/security/limits.conf
添加
*		soft		nofile		1769445
*		hard		nofile		1029345
*		soft		nproc		unlimited

5. 关闭透明大页面(所有节点)

echo never > /sys/kernel/mm/transparent_hugepage/defrag
echo never > /sys/kernel/mm/transparent_hugepage/enabled

vim /etc/rc.d/rc.local
添加如下内容
if test -f /sys/kernel/mm/transparent_hugepage/enabled; then
	echo never > /sys/kernel/mm/transparent_hugepage/enabled
fi
if test -f /sys/kernel/mm/transparent_hugepage/defrag; then
	echo never > /sys/kernel/mm/transparent_hugepage/defrag
fi

?6.设置swappiness(所有节点)

sysctl vm.swappiness=1
echo 1 > /proc/sys/vm/swappiness

vim /etc/sysctl.conf
vm.swappiness=1

7.配置host映射(对于本机也不要写127.0.0.1)

vim /etc/hosts
10.0.8.9    node-01
10.0.8.14   node-02
10.0.8.12   node-03

8.配置免密登录

在每台服务器下执行以下操作:

ssh-keygen -t rsa

一路回车即可。可以发现 ssh目录下的两枚钥匙,分别是id_rsa、id_rsa.pub,其中第一个为密钥,第二个为公钥。

拷贝node-01的公钥到node-02、node-03:

ssh-copy-id -i .ssh/id_rsa.pub root@fluxes-node-02
ssh-copy-id -i .ssh/id_rsa.pub root@fluxes-node-03

拷贝node-02的公钥到node-01、node-03:

ssh-copy-id -i .ssh/id_rsa.pub root@fluxes-node-01
ssh-copy-id -i .ssh/id_rsa.pub root@fluxes-node-03

?拷贝node-03的公钥到node-01、node-02:

ssh-copy-id -i .ssh/id_rsa.pub root@fluxes-node-01
ssh-copy-id -i .ssh/id_rsa.pub root@fluxes-node-02

9.安装JDK

10.安装MySQL

参考:CentOS 7.6下安装MySQL 5.7_JAVA飘香-CSDN博客

11.初始化MySQL权限

mysql -uroot -p

# 新建scm用户
CREATE USER 'cdh'@'%' IDENTIFIED BY '123456'; 
grant all privileges on *.* to 'root'@'%' identified by '123456' with grant option;
grant all privileges on *.* to 'cdh'@'%' identified by '123456' with grant option;
flush privileges;

10.创建CM需要的库

CREATE DATABASE scm DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE hive DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE amon DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE rman DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE hue DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE metastore DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE sentry DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE nav DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE navms DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE oozie DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;


11.安装MySQL JDBC驱动(yum安装的不可用)

# 下载
wget https://dev.mysql.com/get/Downloads/Connector-J/mysql-connector-java-5.1.49.tar.gz
# 解压
tar -zxf mysql-connector-java-5.1.49.tar.gz
# 创建目录
mkdir /usr/share/java/
# 放到指定目录
(一定要改名为mysql-connector-java.jar)
sudo cp mysql-connector-java-5.1.49/mysql-connector-java-5.1.49-bin.jar /usr/share/java/mysql-connector-java.jar

三、Cloudera Manager 安装部署

1.下载CM的压缩包并上传到集群中的某台主机(hadoop102.example.com),并解压

tar -zxvf cm6.3.1-redhat7.tar.gz

2.进入解压之后的路径,执行以下命令,以发布该yum仓库

cd cm6.3.1
nohup python -m SimpleHTTPServer 8900 &

可用浏览器访问
http://node-01:8900 地址,如响应如下页面,则表示yum仓库发布成功

3.在所有主机上创建yum仓库repo文件

vim /etc/yum.repos.d/cloudera-manager.repo

[cloudera-manager]
name=Cloudera Manager 6.3.1
baseurl=http://node-01:8900/
gpgkey=http://node-01:8900/RPM-GPG-KEY-cloudera
gpgcheck=1
enabled=1
autorefresh=0
type=rpm-md

4.在主节点执行:
yum -y install cloudera-manager-daemons cloudera-manager-agent cloudera-manager-server

5.在从节点执行:

sudo yum -y install cloudera-manager-daemons cloudera-manager-agent

6.在所有节点修改配置文件/etc/cloudera-scm-agent/config.ini?,修改其server_host参数

[General]
# Hostname of the CM server.
server_host=node-01

四、初始化数据库

4.1 建库

CREATE DATABASE scm DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE amon DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE hue DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE metastore DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE sentry DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE oozie DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;

4.2 初始化

/opt/cloudera/cm/schema/scm_prepare_database.sh --host node-01 --scm-host node-01  mysql scm root 123456

?五 启动CM

1.在主节点(node-01)执行以下命令,启动Server 和 Agent

systemctl start cloudera-scm-server cloudera-scm-agent

2.在其余节点执行以下命令,启动Agent

systemctl start cloudera-scm-agent

?3.本地访问:

curl localhost:7180
<head><meta http-equiv="refresh" content="0;url=/cmf/"></head>

4.浏览器访问:

?

六 部署CDH

Cloudera Manager d节点的/opt/cloudera/p

1.上传CDH parcel到Cloudera Manager Server

节点的/opt/cloudera/parcel-repo路径下,上传CDH所需parcel

2.为parcel文件生成SHA1校验文件

sha1sum CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel | awk '{ print $1 }' > CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha

3.更改parcel文件所有者

chown -R cloudera-scm:cloudera-scm /opt/cloudera/parcel-repo/*

4.重启Cloudera Manager,令其识别到本地库

sudo systemctl restart cloudera-scm-server

5.登录Cloudera Manager,初始用户名和密码均为admin?

按照导航,选择所有主机,选择安装方式:

成功安装:

?

6.检查网络和主机?

?确保检查结果完全正确,如有问题点击检查详情,按照引导进行修复,修复完毕后,方可点击“继续”:

?

?

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-03-11 22:17:06  更:2022-03-11 22:18:20 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 9:20:59-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码