IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Kafka生产优化之集群重要参数配置详解与优化设置 -> 正文阅读

[大数据]Kafka生产优化之集群重要参数配置详解与优化设置

1.Broker端配置详解

1.1 必配参数

在这里插入图片描述

1.2 监听器相关参数

在这里插入图片描述

1.3 主题相关参数

在这里插入图片描述

1.4 线程相关参数

在这里插入图片描述

1.5 压缩相关参数

生产中,一般Kafka会配置压缩以减少磁盘占用。

在这里插入图片描述
附:Facebook Zstandard官网提供的压缩算法对比结果:

在这里插入图片描述

1.6 ZooKeeper相关参数

ZK相关的参数一般不做修改。默认即可。

在这里插入图片描述

1.7 重平衡与选举相关参数

重平衡相关参数需要根据实际需求进行调整,原理类似于HDFS中的重平衡。

在这里插入图片描述

1.8 日志刷写相关参数

在Linux系统中,当我们把数据写入文件系统之后,其实数据在操作系统的pagecache里面,并没有刷到磁盘上。如果操作系统挂了,数据就丢失了。一方面,应用程序可以调用fsync这个系统调用来强制刷盘,另一方面,操作系统有后台线程,定时刷盘。频繁调用fsync会影响性能,需要在性能和可靠性之间进行权衡。实际上,官方不建议通过上述的三个参数来强制写盘,认为数据的可靠性通过replica来保证,而强制flush数据到磁盘会对整体性能产生影响。

Kafka的持久性并非要求同步数据到磁盘,因为问题节点都是从副本中恢复数据。这样刷盘依赖操作系统及Kafka的后台刷盘机制。这样的好处是:无需调优、高吞吐量、低延时和可全量恢复。

操作系统一般默认30s刷盘一次。

在这里插入图片描述

1.9 日志保留相关参数

日志保留相关参数需要根据具体的生产实际及磁盘容量与数据量进行调整。

在这里插入图片描述

1.10 日志滚动切片相关参数

日志滚动与切片参数建议根据生产实际进行调整。

在这里插入图片描述

1.11 元数据相关参数

元数据相关参数一般不做调整。

在这里插入图片描述

1.12 副本相关参数

副本相关参数一般不做调整。

在这里插入图片描述

1.13 offset相关参数

offset内部主题相关参数,一般保持默认即可。

在这里插入图片描述

1.14 消息相关参数

在这里插入图片描述

2.Topic级别配置详解

topic级别的参数,一般都在broker中对应有默认配置,但是也可以对单独的topic进行设置,可以在topic创建之初使用–config来进行指定,也可以在创建完成之后再进行修改。

以下是比较重要的topic级别的参数配置。

2.1 日志清理压缩相关参数

在这里插入图片描述

2.2 日志刷写相关参数

在这里插入图片描述

2.3 索引相关参数

在这里插入图片描述

2.4 消息、副本与选举相关参数

在这里插入图片描述

2.5 日志保留与滚动相关参数

在这里插入图片描述

3.Producer端配置详解

Producer负责向服务器发送数据,在实际生产中,更多的是使用API作为Producer端进行数据发送。

以下是Producer端中比较重要的配置参数。

3,1 序列化、分区器、拦截器相关参数

在这里插入图片描述

3.2 集群地址与压缩相关参数

在这里插入图片描述

3.3 批处理相关参数

在这里插入图片描述

3.4 TCP缓冲相关参数

在这里插入图片描述

3.5 消息有序性相关参数

在这里插入图片描述

3.6 事务相关参数

在这里插入图片描述

4.Consumer端配置详解

Consumer对数据进行消费,一般通过流处理框架对Kafka中的数据进行消费处理,因此,Consumer端是否消费正常对于数据处理显得尤为重要。

以下是Consumer端的重要参数。

4,1 必配参数

在这里插入图片描述

4.2 反序列化、拦截器相关参数

在这里插入图片描述

4.3 自动提交offset参数

在这里插入图片描述

4.4 拉取数据相关参数

在这里插入图片描述

4.5 分区分配策略参数

在这里插入图片描述

4.6 TCP缓冲及其他参数

在这里插入图片描述

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-02-26 11:37:32  更:2022-02-26 11:41:11 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 11:34:55-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码