IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> day09 ----- Kafka -> 正文阅读

[大数据]day09 ----- Kafka

学习链接

问题

  1. Kafka 为什么那么快?
    1)顺序读写
    2)直接使用系统自身缓存
    3)零拷贝(直接复制到NIC缓冲区,避免重新复制数据)
    4)分区,分段,索引
    5)批量处理,合并小的请求,以流的方式进行交互

  2. Kafka 的整体架构?
    zookeeper:分布式协调服务,协调kafka应用。
    broker:kafka的节点。
    producer:生产者生产数据
    consumer:消费者消费数据。
    consumer group :消费者组,组内的消费者默认是不能重复消费。
    topic:主题,是消息的归类。
    partition:分区,将数据分为多份,进行存储。
    replicas:副本,数据是冗余存储的。
    segment:文件段,文件按照1个g大小进行拆分。主要包括两个文件.index索引和.log日志文件。

  3. ack参数?

    0:生产者只负责发送数据,不关心数据是否丢失,响应的状态码为0(丢失的数据,需要再次发送)
    1:partition的leader收到数据,响应的状态码为1
    -1:所有的从节点都收到数据,响应的状态码为-1

  4. kafka 服务启动

    # & 后台启动
    cd /opt/servers/kafka_2.12-2.2.0
    nohup bin/kafka-server-start.sh config/server.properties 2>&1 &
    
  5. 停止

    cd /opt/servers/kafka_2.12-2.2.0
    bin/kafka-server-stop.sh
    

1 kafka

1.1 简介

实时数据处理

没有主从,通过zookepper 完成协调

在这里插入图片描述

1.2 集群配置

上传解压

cd /opt/softwares
tar -xvzf kafka_2.12-2.2.0.tgz -C ../servers/

修改配置文件

hadoop01服务器修改kafka配置文件
hadoop01执行以下命令进入到kafka的配置文件目录,修改配置文件

hadoop01执行以下命令创建数据文件存放目录

mkdir -p  /opt/servers/kafka_2.12-2.2.0/logs 

cd /opt/servers/kafka_2.12-2.2.0/config

vim server.properties

修改以下内容

broker.id=0
log.dirs=/opt/servers/kafka_2.12-2.2.0/logs
zookeeper.connect=hadoop01:2181,hadoop02:2181,hadoop03:2181
delete.topic.enable=true # 默认关闭,需额外添加

安装包分发到其他服务器

hadoop01执行以下命令,将hadoop01服务器的kafka安装包发送到hadoop02和hadoop03服务器

cd /opt/servers/

scp -r kafka_2.12-2.2.0/ hadoop02:$PWD
scp -r kafka_2.12-2.2.0/ hadoop03:$PWD

hadoop02与hadoop03服务器修改配置文件

hadoop02与hadoop03服务器修改kafka配置文件

hadoop02使用以下命令修改kafka配置文件

cd /opt/servers/kafka_2.12-2.2.0/config

vim server.properties

broker.id=1
log.dirs=/opt/servers/kafka_2.12-2.2.0/logs
zookeeper.connect=hadoop01:2181,hadoop02:2181,hadoop03:2181
delete.topic.enable=true

hadoop03使用以下命令修改kafka配置文件

cd /opt/servers/kafka_2.12-2.2.0/config

vim server.properties

broker.id=2
log.dirs=/opt/servers/kafka_2.12-2.2.0/logs
zookeeper.connect=hadoop01:2181,hadoop02:2181,hadoop03:2181
delete.topic.enable=true

启动与停止

注意事项:在kafka启动前,一定要让zookeeper启动起来。
可三台同时 ,执行以下命令将kafka进程启动在后台

cd /opt/servers/kafka_2.12-2.2.0

nohup bin/kafka-server-start.sh config/server.properties 2>&1 &

&:后台启动
2>&1: 会产生日志,有异常可在日志查看

后台启动
在这里插入图片描述
在这里插入图片描述

1.3 集群操作

创建主题

bin/kafka-topics.sh --create --topic test --bootstrap-server hadoop01:9092,hadoop02:9092,hadoop03:9092 --partitions 3 --replication-factor 2

查看主题

bin/kafka-topics.sh --list --bootstrap-server hadoop01:9092

生产者生产数据

bin/kafka-console-producer.sh --topic test --broker-list hadoop01:9092,hadoop02:9092

生产数据保存到哪?

消费者

bin/kafka-console-consumer.sh --topic test --from-beginning --bootstrap-server hadoop01:9092

在这里插入图片描述
为什么这样接收数据
在这里插入图片描述

全局乱序,局部(分区)有序

查看topic的相关信息

bin/kafka-topics.sh --describe --topic test --bootstrap-server hadoop01:9092,hadoop02:9092,hadoop03:9092

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

leader 是由zookepper指定的
副本数 Replicas 两个指定的不同节点

在这里插入图片描述
cousumer offsets 0-50
消费者 ---- 偏移量

增加topic分区数

任意kafka服务器执行以下命令可以增加topic分区数

cd /opt/servers/kafka_2.12-2.2.0

bin/kafka-topics.sh --bootstrap-server hadoop01:9092 --alter --topic test --partitions 5

producer生产者基于topic主题生产消息

分区:

mmap 可以直接内存操作: 零拷贝
ack 确认队列

如何保证数据不丢失?
保证数据不丢失,自身有副本数机制,副本因子
从消费者角度:接收数据时,保存好offset 值即可

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-03-13 21:52:47  更:2022-03-13 21:55:45 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 7:31:45-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码