IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Kafka学习笔记 -> 正文阅读

[大数据]Kafka学习笔记

Kafka

Kafka线上集群部署

操作系统

推荐Linux,以下三个方面优势:

  • I/O模型的使用(epoll)
  • 数据网络传输效率(零拷贝)
  • 社区支持度

磁盘

Kafka大量使用顺序读写,使用机械磁盘即可

RAID(磁盘阵列):优势

  • 提供冗余的磁盘存储空间
  • 提供负载均衡

Kafka在存储方面提供了便捷的高可靠性方案,故对RAID不是特别依赖,普通机械磁盘即可

磁盘容量

规划磁盘容量时需要考虑下面几个元素:

  • 新增消息数
  • 消息留存时间
  • 平均消息大小
  • 备份数
  • 是否启用压缩

带宽

重要的集群配置参数

Broker端参数

文件路径相关

  • log.dirs

    指定了Broker需要使用的若干个文件目录路径。无默认值,需要手工指定。为CSV格式参数,多个配置项以逗号分隔

  • log.dir

    标识单个路径,补充上一个参数

推荐配置:只设置log.dirs,不要设置log.dir

zk相关

  • zookeeper.connect

    CSV格式的参数,如:zk1:2181,zk2:2181,zk3:2181

    Broker连接相关

  • listeners

    监听器,告诉外部连接者通过什么协议访问指定主机名和端口开放的Kafka服务

  • advertised.listeners

    这组监听器是Broker用于对外发布的

  • host.name/port 过期废弃

监听器–>三元组<协议名称, 主机名, 端口号>

第二个参数推荐使用主机名,而不使用IP

Topic管理相关

  • auto.create.topcs.enable

    是否允许自动创建主题,推荐设为false

  • unclean.leader.election.enable

    关闭unclean Leader的选举,推荐设为false

  • auto.leader.rebalance.enable

    更换Leader,推荐设为false

数据保存相关

  • log.retention.{hours|minutes|ms}

    一条数据的保存时间,ms优先级最高,通常使用hours;如log.retention.hours=168–>默认保留7天的数据

  • log.retention.bytes

    Broker为消息保存的总磁盘大小,默认为-1,不设大小限制

  • message.max.bytes

    控制Broker能接受的最大消息大小,默认1M不到,太小,建议设置大一些

    Topic级别参数

Topic级别参数会覆盖全局Broker参数,优先级更高。每个Topic也可以设置自己的参数

消息保存相关

  • retention.ms

    规定该topic消息保存时长,默认7天,会覆盖Broker端参数

  • retention.bytes

    为该Topic预留多大磁盘空间,默认-1,无限制。多租户Kafka集群中有用武之地

  • max.message.bytes

    决定Broker能正常接收该topic的最大消息大小

Topic级别参数如何设置

  • 创建Topic时设置
  • 修改Topic时设置

JVM参数

Java7

  • XX:+UseCurrentMarkSweepGC或-XX:UseParallelGC

Java8

  • -XX:UseG1GC

  • KAFKA_HEAP_OPTS:指定堆大小

  • KAFKA_JVM_PERFORMANCE_OPTS:指定GC参数

操作系统参数

  • 文件描述符限制

    ulimit-n,通常设置为一个超大值,否则容易出现“Too many open files”错误

  • 文件系统类型

  • Swappiness

    建议设为一个接近0但不为0的值

  • 提交时间

    page cache中脏数据刷盘时间间隔,关系吞吐量与数据安全性

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-07 12:09:17  更:2021-08-07 12:09:29 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/19 4:41:00-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码