apachekafka（apachekafka官网）

本文目录一览：

很明显是类型转换错误。即Integer 类型不能转成String类型。

消费会报错(比如场景一：一个consumer group消费某topic，当consumer group间隔几天不消费，Kafka内部数据会自动清除之前的数据，程序再次启动时，会找之前消费到的offset进行消费，此时，若Kafka已经删除此offset值，就会产生此报错。

最近部门使用的Kafka从v0.2升级到v1，遇到了几个错误，记录一下。在灰度producer的时候，遇到了这个问题。

第一条错误，第二条正确，try catch中第一条自定发到死信，第二条会正确入库。

在Windows中安装Kafka成功，第一次启动也没有问题。

kafka集群controller的一项功能是在partition的副本中选择一个副本作为leader副本。在topic的partition创建时，controller首先分配的副本就是leader副本，这个副本又叫做preference leader副本。-apachekafka

1、Kafka可以作为分布式系统的一种外部提交日志。日志有助于在节点之间复制数据，并充当故障节点的重新同步机制，以恢复它们的数据。Kafka的日志压缩特性支持这种用法。在这种用法中，Kafka类似于Apache BookKeeper项目。-apachekafka

2、在大多使用场景下，数据处理的顺序都很重要。大部分消息队列本来就是排序的，并且能保证数据会按照特定的顺序来处理。Kafka保证一个Partition内的消息的有序性。

3、Kafka是由Apache软件基金会开发的一个开源流处理平台，由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者在网站中的所有动作流数据。

4、高吞吐量、低延迟 kafka每秒可以处理几十万条消息，它的延迟最低只有几毫秒，每个topic可以分多个partition， consumer group 对partition进行consume操作。-apachekafka

1、关注《大数据技术进阶》微信公众号，及时查看更多大数据技术干活！ kafka在所有broker中选出一个controller，所有Partition的Leader选举都由controller决定。-apachekafka

2、相信看见题目的同学都会很有疑问，甚至不服气，这都是基于个人对于kafka原理的理解，我可以说磁盘顺序写要比内存的随机读快吧。但是说到底，基于性能的优化方面，还是离不开内存的。

3、Kafka没有提供同步刷盘的方式。同步刷盘在RocketMQ中有实现，实现原理是将异步刷盘的流程进行阻塞，等待响应，类似ajax的callback或者是java的future。下面是一段rocketmq的源码。-apachekafka

4、因为kafka数据是持久化磁盘的，还速度快；还可靠、支持分布式…… 啥！用了磁盘，还速度快！！没错，kafka就是速度无敌，本文将探究kafka无敌性能背后的秘密。

apachekafka（apachekafka官网）