Kafka是一个分布式流式数据平台,它具有三个关键特性
关于Topic和Partition
Topic分类的消息流,相关的消息保存于Partition中
Topic是Producer发布消息,以及consumer消费消息使用的端点
Partition代表Topic中的数据分片,在其它数据库系统中,通常称为replica或shard
能够将一个Topic中的数据并行存储于多个broker上;
支持以冗余机制(复制因子大于1)存储多个副本,并能容忍最多N-1个服务器故障,N为复制
因子数量;
消费者读取一个Topic时,它将从所有Partition中读取数据