本篇文章会介绍Kafka，了解kafka是什么，主要用途是什么，了解kafka的特性，以及kafka集群安装，kafka核心概念、工作原理；做一个kafka。

简介

强调一个点是流式的计算，流处理，流存储，都强调一个流。

Kafka? 用于构建实时的数据管道和流式的app.它可以水平扩展，高可用，速度快，并且已经运行在数千家公司的生产环境。

kafka是为了做了分布式流式安全存储数据的平台，水平的扩展集群，天生就是存储，就算数据消费完了也不会删除。

上图体现在kafka集群可以高可用，达到送数据的效果，以及推送数据的效果。

Kafka? 用于构建实时的数据管道和流式的app.它可以水平扩展，高可用，速度快，并且已经运行在数千家公司的生产环境。

所谓的流式处理，把kafka的数据取过去，有序的处理完了在传送过去，也可以把db里面的数据拿到并处理传送回去。

kafka体系结构

有五大组件，生产者、消费者、流式处理、连接器、消息中间件。

在Kafka中，客户端和服务器使用一个简单、高性能、支持多语言的?TCP 协议.此协议版本化并且向下兼容老版本，我们为Kafka提供了Java客户端，也支持许多其他语言的客户端。

安装

环境要求

kafka是scala开发的。但是需要java虚拟机上运行，所以需要java1.8以上

安装

配置目录? ?server.properties? 的 kafka配置文件? ，以及zookeeper.properties? zk配置文件

服务端口并可以指定 ip地址，默认采用主机名。? ? 默认就是9092 ；

以及 advertised.listeners? 发布给生产者和消费者连接地址? 没有配置? ? 这个会发布到zk上去

下面其他的包括数据目录? 这里并不是日志目录。以及主题? 元数据存放的zookeeper目录

启动

[root@node4 ~]# cd /usr/kafka/latest/ 
[root@node4 latest]# bin/zookeeper-server-start.sh config/zookeeper.properties &

启动Kafka

[root@node4 latest]# bin/kafka-server-start.sh config/server.properties &

集群搭建

本身是分布式的

【生产集群】在其他机器上同样安装 kafka ，配置它们连接到同一个 zookeeper 集群、它们的唯一 id ，数据目录，启动Broker 实例即加入集群。

拷贝配置文件

[root@node4 latest]# cp config/server.properties config/server-1.properties 
[root@node4 latest]# cp config/server.properties config/server-2.properties

修改配置文件：confifig/server-1.properties:

broker.id=1 
listeners=PLAINTEXT://:9093 
log.dirs=/var/kafka-logs-1

confifig/server-2.properties:

broker.id=2 
listeners=PLAINTEXT://:9094
log.dirs=/var/kafka-logs-2

启动这两个broker实例

[root@node4 latest]# bin/kafka-server-start.sh config/server-1.properties & 
[root@node4 latest]# bin/kafka-server-start.sh config/server-2.properties &

【启动失败说明】 如果启动第二个或第三个 broker 时提示内存不够用，可以做如下调整：

调大你的虚拟机的内存（1G 或更多）
调小Kafka的堆大小，默认是1G，生产用时可以调大。可以调为256M（不能太小了，启动时会heap OOM)

[root@node4 latest]# vi bin/kafka-server-start.sh

export KAFKA_HEAP_OPTS="-Xmx256M -Xms256M" 最大最小设为同一值（减少内存的申请和

回收）

[root@node4 latest]# bin/kafka-topics.sh --create --bootstrap-server 192.168.100.12:9092 --replication-factor 3 --partitions 1 --topic my-13-topic 
[root@node4 latest]# 
[root@node4 latest]# 
[root@node4 latest]# bin/kafka-topics.sh --describe --bootstrap-server 192.168.100.12:9092 --topic my-13-topic 
Topic:my-13-topic PartitionCount:1 ReplicationFactor:3 Configs:segment.bytes=1073741824 Topic: my-13-topic Partition: 0 Leader: 0 Replicas: 0,2,1 Isr: 0,2,1

--replication-factor 3 备份因子副本数 3

--partitions 1 分片数这个主题有几个分片

创建了一个有一个分片，每个分片有 3 个副本的主题 my-13-topic 。

分片是对主题 Topic 的数据的分布式存储，它是对数据的物理分割。但它本身是一个逻辑概念。

分片的存储实体是副本 3 个副本，就是这个分片的数据会存 3 份。

Topic: my-13-topic Partition: 0 Leader: 0 Replicas: 0,2,1 Isr: 0,2,1

Partition: 0 分片号

Leader: 0 leader 副本在 0 号 Broker 上

Replicas: 0,2,1 三个副本位于 0 2 1 号 broker 上

Isr: 0,2,1 in sync 处于同步状态的 broker

分片和 broker 的关系

broker: 一般是一台计算机上一个 Broker

分片：分片的一个副本存放在一个 broker 上。

分片数是在创建主题时根据你的估算数据量来选择的。

bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --from-beginning --topic my-replicated-topic

监控管理工具?

Kakfa 自身未提供图形化的监控管理工具，市面上有很多开源的监控管理工具，但都不怎么成熟可靠。

Kafka Offffset Monitor

kafkaoffsetmonitor · GitHub Topics

可以实时监控：

Kafka集群状态
Topic、Consumer Group列表
bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --from-beginning
--topic my-replicated-topic图形化展示topic和consumer之间的关系
图形化展示consumer的Offffset、Lag等信息

它是一个 jar 包，使用很简单

java -cp KafkaOffsetMonitor-assembly-0.2.1.jar \ com.quantifind.kafka.offsetapp.OffsetGetterWeb \ 
--offsetStorage kafka --zk zk-server1,zk-server2 \ 
--port 8080 \ 
--refresh 10.seconds \ 
--retain 2.days

?0.2.0 版本启动命令

java -cp KafkaOffsetMonitor-assembly-0.2.0.jar \ com.quantifind.kafka.offsetapp.OffsetGetterWeb \ 
--zk zk-server1,zk-server2 \
--port 8088 \ 
--refresh 10.seconds \ 
--retain 2.days

启动后就可以在浏览器中访问了： http://localhost:8088

spring中使用

Spring for Apache Kafka

SpringforApacheKafka（SpringKafka）项目将核心Spring概念应用于基于Kafka的消息传递解决方案的开发。它提供了一个“模板”，作为发送消息的高级抽象。它还支持带有@KafkaListener注释和“侦听器容器”的消息驱动POJO。

这些库促进了依赖项注入和声明性的使用。在所有这些情况下，您将看到与Spring框架中的JMS支持和Spring AMQP中的RabbitMQ支持的相似之处。

KafkaTemplate
KafkaMessageListenerContainer
@KafkaListener
KafkaTransactionManager
spring-kafka-test

?在maven项目中引用

<dependency>
  <groupId>org.springframework.kafka</groupId>
  <artifactId>spring-kafka</artifactId>
  <version>2.8.0-RC1</version>
</dependency>

添加配置，包括序列化器

在spring中配置 kafka配置类。包括提前配置好的一些事务等等。

?数据消费创建主题等。

?配置一个消费消费消息重试三次还不成功，将消息发送到死信队列。

public class Sender {

	public static void main(String[] args) {
		AnnotationConfigApplicationContext context = new AnnotationConfigApplicationContext(Config.class);
		context.getBean(Sender.class).send("test", 42);
	}

	private final KafkaTemplate<Integer, String> template;

	public Sender(KafkaTemplate<Integer, String> template) {
		this.template = template;
	}

	public void send(String toSend, int key) {
		this.template.send("topic1", key, toSend);
	}

}

public class Listener {

    @KafkaListener(id = "listen1", topics = "topic1")
    public void listen1(String in) {
        System.out.println(in);
    }

}

@Configuration
@EnableKafka
public class Config {

    @Bean
    ConcurrentKafkaListenerContainerFactory<Integer, String>
                        kafkaListenerContainerFactory(ConsumerFactory<Integer, String> consumerFactory) {
        ConcurrentKafkaListenerContainerFactory<Integer, String> factory =
                                new ConcurrentKafkaListenerContainerFactory<>();
        factory.setConsumerFactory(consumerFactory);
        return factory;
    }

    @Bean
    public ConsumerFactory<Integer, String> consumerFactory() {
        return new DefaultKafkaConsumerFactory<>(consumerProps());
    }

    private Map<String, Object> consumerProps() {
        Map<String, Object> props = new HashMap<>();
        props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "localhost:9092");
        props.put(ConsumerConfig.GROUP_ID_CONFIG, "group");
        props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, IntegerDeserializer.class);
        props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
        props.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");
        // ...
        return props;
    }

    @Bean
    public Sender sender(KafkaTemplate<Integer, String> template) {
        return new Sender(template);
    }

    @Bean
    public Listener listener() {
        return new Listener();
    }

    @Bean
    public ProducerFactory<Integer, String> producerFactory() {
        return new DefaultKafkaProducerFactory<>(senderProps());
    }

    private Map<String, Object> senderProps() {
        Map<String, Object> props = new HashMap<>();
        props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, "localhost:9092");
        props.put(ProducerConfig.LINGER_MS_CONFIG, 10);
        props.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, IntegerSerializer.class);
        props.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, StringSerializer.class);
        //...
        return props;
    }

    @Bean
    public KafkaTemplate<Integer, String> kafkaTemplate(ProducerFactory<Integer, String> producerFactory) {
        return new KafkaTemplate<Integer, String>(producerFactory);
    }

}

监控数据都是使用KafkaListener 注解? ?监听收到消息

@KafkaListener(id = "multiGroup", topics = { "foos", "bars" })

在运行的时候

发生的时候 type

foo:com.study.kafka.sample_01_pub_sub.common.Foo1,bar:com.study.kafka.sample_02_multi_method_listener.common.Bar1

在json转换时，发送时，消费者根据收到的消息去转

对于转换失败的，会抛异常。

?通过spring的思想，都是配置得到。

MessageConverter的调用

[大数据]Kafka的简介

前言

简介

kafka体系结构

安装

环境要求

安装

启动

集群搭建

监控管理工具?

spring中使用