1、kafka中ISR,OSR,AR代表什么
ISR: OSR: AR:全部副本
2、hIw和leo代表什么
hiw:高水位,消费者可见的最大的offset leo:每一个分区多个副本都有一个最大的offset
3、分区器,序列化器,拦截器是否了解,处理顺序
拦截器–>序列化器–>分区器
4、kafka生产者端整体结构什么样子,使用几个线程处理,分别是什么
2个线程,main线程(取数据,分区,将数据写到共享区),send线程取数据
5、消费者提交消费位移时提交的是当前消费到的最新消息的offset还是
offset+1? offset+1,offset从0开始存,消费者保存的是1开始
6、哪些情形导致数据重复消费
不是ack,ack是生产端的 先处理完数据,在提交offset 先提交offset,在处理数据,可能造成数据丢失
7、当创建删除一个topic时,kafka背后执行了什么逻辑
(1)会在zookeeper中的/broker/topic节点下创建下一个新的topic节点 (2)触发controller的监听程序 (3)kafka controller负责topic的创建工作,并更新metadata cache
8、topic可增不可减
增:新的分区,获取当前可用分区 减:数据无法处理
9、kafka内部有topic
作用:给普通的消费者offset使用的
10、kafka controller作用
与zookeeper交互 ,元数据的更新都是通过它实现的
11、kafka选举
(1)controller :抢资源方式选举 (2)leader:通过ISR,通过时间,通过条数机制选举(0.9版本条数不用了)
12、失效副本指什么
ISR
|