IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 2021/8/18 大数据实训第三(二)天 -> 正文阅读

[大数据]2021/8/18 大数据实训第三(二)天

一、克隆三台服务器

1、克隆

须提前将要克隆的服务器关闭
在这里插入图片描述

2、修改主机名

临时修改:hostname hadoop02(修改后的主机名
永久修改:vim /etc/sysconfig/network
HOSTNAME=hadoop02
zookeeper集群最好是奇数个集群

3、固定ip

在这里插入图片描述
去掉选中的行,并将最后一行的eth1改为eth0
在这里插入图片描述
在这里插入图片描述
将选中的区域改为上面最后一行中的address,并删除uuid一行
在这里插入图片描述
setup配置地址
service network restart重启

二、配置免密登录

1、在每台服务器上生成公私钥:

ssh-keygen(然后一路回车即可)
在这里插入图片描述

2、将公钥远程注册给其他的服务器

			ssh-copy-id 其他服务器的ip地址/主机名

对每一台均做如下操作
在这里插入图片描述
经验证:免密登录成功
访问其余主机:ssh + 其他服务器的ip地址/主机名
退出:exit
在这里插入图片描述

3、配置主机名和ip地址的映射

对每一个主机做如下操作
在这里插入图片描述
在这里插入图片描述

三、关闭防火墙

临时关闭 service iptables stop
永久关闭 chkconfig iptables off
在这里插入图片描述
对打开的三个主机一起执行关闭防火墙的操作,可以利用xShell的右下角中的标签,在下放输入命令,则三台机器都会执行
在这里插入图片描述 在这里插入图片描述

四、zookeeper集群配置

1、删除之前配置的伪分布式

进入/home/software执行rm -rf zookeeper-3.4.7
在这里插入图片描述

2、重新解压

在这里插入图片描述

3、拷贝模板文件起名为zoo.cfg并修改zoo.cfg

在这里插入图片描述
(1)修改dataDir属性
在这里插入图片描述
(2)并在文件末尾加上如下内容
2888:原子广播的端口
3888:选举的端口
注意:配置文件的等号的左右两端不能有空格
在这里插入图片描述

4、创建目录及文件

在zookeeper的安装目录创建一个tmp目录,并在tmp目录创建myid文件
在这里插入图片描述
myid文件中的内容
在这里插入图片描述

5、拷贝

将hadoop01中配置好的zookeeper复制到hadoop02与hadoop03中,并根据服务器的service好,配置myid编号
(1)删除原先存在的zookeeper
在这里插入图片描述
(2)复制
在这里插入图片描述
(3)修改编号
在这里插入图片描述 在这里插入图片描述

6、启动

hadoop01
![在这里插入图片描述](https://img-blog.csdnimg.cn/f511eae33d394ae6b317c321c2c251b1.png
hadoop02
![在这里插入图片描述](https://img-blog.csdnimg.cn/67a7b3ca1dfc41939f640cd30a2cffc9.png
hadoop03
在这里插入图片描述
出错排查:先把进程停掉,环境变量,防火墙,配置文件,myid
启动日志:bin目录下的zookeeper.out

五、zookeeper选举机制

(一)概述

1、当一个zookeeper集群在启动的时候,会进入选举状态,此时所有的节点(服务器)都会推荐自己当leader。并且会把自己的选举信息发送给其它节点
2、当节点收到其他节点发送过来的选举信息之后,会两两进行比较,最后胜出的节点当leader

(二)细节

1、选举信息包括:
a. 当前节点的最大事务id
b. 选举编号,即myid
c. 逻辑始终值-保证选举的轮数
2、比较原则
a. 先比较最大事务id,谁大谁赢
b. 如果事务id一样的话,比较myid,谁大谁赢
c. 如果一个节点胜过了一半以上的节点,那么这个节点就是leader–过半性
3、在zookeeper中,不存在单点故障的说法,如果leader宕机,那么整个集群会选举一个新的leader继续对外提供服务
4、如果leader宕机之后重新启动,这个时候会看作一个新的节点加入集群,此时这个节点一定是follower
5、如果一个集群已经选举出来leader,为了维持集群的稳定性,无论新添加的节点的事务id和myid是多少,都不会触发leader的重新选举,新加的节点只能是follower
6、如果一个集群出现多个leader,这种现象叫做脑裂
7、zookeeper出现脑裂的条件是:
a. 集群产生分裂
b. 分裂后产生了选举
8、在zookeeper中如果存活的节点(可以相互通信的服务器)不足一半,则这些节点不会发生选举。此时这些节点也不会对外提供服务–过半服务的特性
9、zookeeper会给每一次选举出来的leader分配一个全局的递增的编号,称之为epochid,当zookeeper发现存在多个leader时,会自动将epochid较小的节点的状态切换成follower,利用这种方案可以保证整个集群只存在唯一的leader
10、集群中节点的状态
a. Looking/voting:选举状态
b. Follower:追随者
c. leader:领导者
d. observer:观察者

六、ZAB协议

(一)概述

1、ZAB(zookeeper Atomic Broadcast)协议专门为zookeeper设计的用于进行原子广播崩溃恢复的一套协议
2、ZAB协议是基于2PC算法设计实现的。利用了过半性+PAXOS进行了改造

(二)原子广播

1、作用:保证集群中各个节点之间的数据是一致的,即访问任意一个节点,获取到的数据都是相同的
2、基于2PC算法设计实现的
3、2PC-two Phase Commi-两阶段提交算法,顾名思义,讲一个请求拆分成两个阶段
a. 请求阶段
在这里插入图片描述b. 提交阶段:如果协调者收到所有参与者返回的yes,那么认为这个请求可以执行,那么就会命令所有的参与者执行这个请求在这里插入图片描述
c. 终止阶段,只要协调者没有收到所有参与者返回的yes,那么就会认为这个请求无法执行,也就要求所有的参与者放弃刚才的请求。
在这里插入图片描述
4、在2PC算法中,要么就是请求执行,要么就是请求中止
5、2PC算法的思想就是"一票否决"
6、2PC算法很容易理解,并且实现也很容易,但在分布式环境中,2PC算法的成功率很低。效率也很低,在2PC算法中引入了PAXOS算法(过半性)的原来进行改进
7、原子广播的过程
follower不处理请求,而是将所有请求转交给leader进行处理——>当leader接收到请求后,会将请求记录到本地的日志中(log.xxx),如果记录成功,leader就会将请求放到队列中发送给follower——>follower收到队列后,会将请求从队列中取出,然后试图记录到本地的日志中。——>如果记录成功,则follower就会认为可以执行这个请求,并且返回给leader一个yes;如果记录失败,则followerr会认为这个请求不能执行,并且返回给leader一个no——>如果leader收到半数以上的节点返回的yes,则会认为这个请求可以执行,就会命令这些follower执行这个请求;半数以上的no,则会任务这个请求不能执行,通知所有的follower删除刚才的记录
8、follower存在记录日志失败的可能,例如,文件被占用、磁盘损坏、磁盘已满。都可能导致日志文件记录失败,这种情况不是zookeeper的原因,zookeeper无法解决
9、

(三)崩溃恢复

1、当leader宕机之后,整个集群并不会就此停止工作,而是会选举出来一个新的leader,继续对外提供服务
2、在zookeeper集群中,会对每一个选举出来的leader分配一个全局递增的唯一的编号,称之为epochid,当leader被选举出来之后,这个leader就会将epochid分发给每一个follower。follower收到这个id之后,就会将这个id存储在acceptedEpoch文件中
3、作用:避免单点故障
4、如果follower记录失败,那么当follower修复成功之后,会给leader发送请求,发送请求的过程中会将自身的事务id告诉leader,leader收到请求之后,如果事务id一样,说明在follower出现问题的时候,leader没有做过任何的事务操作。leader的事务id大于follower的事务id,这个时候leader会将差的事务请求放到队列中发送给follower。要求follower补齐事务。在follower没有补齐事务之前不对外提供服务

(四)观察者

概述
1、observer在zookeeper集群中既不参见选举也不参加投票,但是会监听投票的结果和选举的结果,
2、observer大致可以理解为没有选举权和投票权的follower。–只有干活的义务没有选举的权利
3、在实际开发过程中,若集群规模较大(节点比较多)的时候,或者网络环境比较差的时候。我们将一个集群中90%-97%的节点设置为observer
在这里插入图片描述

在集群规模较大的时候,由于信号丢失会造成选举无效(不过半(设置的总数)),如果出现上述情况,选举的效率就比较低;集群规模较大的时候,网络因素不确定。如果导致选举无效的话,就会触发新一轮的选举。效率非常低下
设置为observer
4、配置observer
a. 修改zoo.cfg
i 添加peerType=observer
ii 在要设置为observer的主机后面添加:observer
在这里插入图片描述
在这里插入图片描述

(五)特征

1、过半性:过半选举、过半存过、过半操作
2、数据一致性:从任意节点获取数据,拿到的数据都是一样的
3、原子性:一个操作要么所有的节点均成功,要么均失败
4、顺序性:所有节点获取到的请求顺序都是一致的–队列
5、可靠性:崩溃恢复
补充:(需先安装nc)
1、查看节点是否宕机:echo ruok|nc hadoop01 2181
2、查看节点状态:echo stat|nc hadoop01 2181
3、查看节点的配置信息:echo conf|nc hadoop01 2181

安装nc-1.84…
首先将nc放入/home/software下
在这里插入图片描述
执行安装命令
在这里插入图片描述
具体操作
在这里插入图片描述

七、分布式一致性算法-Paxos

没有具体的公式,只是一个思想,见ppt

八、查看日志(不是乱码状态)

复制两个包到/tmp/version-2下
在这里插入图片描述
使用如下命令查看
在这里插入图片描述

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-19 12:07:10  更:2021-08-19 12:08:31 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/18 18:09:51-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码