【Kafka源码解读和使用指南】第14篇：Kafka分区器源码解析——消息去哪个分区，有学问！

发布时间：2026/6/8 12:07:59

上一篇【第13篇】Kafka序列化器深度解析——自定义Serializer不再是难题下一篇【第15篇】Kafka集群元数据源码解析——生产者如何认识整个集群摘要消息经过序列化变成byte[]之后下一步就是决定发往哪个分区。这一决定看似简单实则影响深远——分对了负载均衡吞吐翻倍分错了热点分区全线崩溃。Kafka的默认分区策略用HashRoundRobin双剑合璧2.4版本推出的Sticky Partitioner更是在延迟和批量之间找到了精细平衡。本文将深入源码剖析分区器的工作原理从DefaultPartitioner到StickyPartitioner再到手把手教你实现一个按业务Key路由的自定义分区器。读完这篇分区不再看运气。一、分区器在KafkaProducer中的位置先回顾分区器在整个发送链路中的位置——它在消息序列化之后、进入RecordAccumulator之前KafkaProducer.send() 调用链 Interceptors.onSend() // ① 拦截器处理 │ ▼ waitOnMetadata() // ② 等待集群元数据就绪 │ ▼ Serializer.serialize() // ③ 序列化Key和Value │ ▼ Partitioner.partition() // ④ 选择目标分区 ← 本文主角 │ ▼ RecordAccumulator.append() // ⑤ 放入缓冲区从调用链可以看出分区器需要依赖两个输入已序列化的Keybyte[]用于计算Hash值集群元数据Cluster对象需要知道Topic有多少个分区二、Partitioner接口——只需要实现partition()方法publicinterfacePartitionerextendsConfigurable,Closeable{/** * 选择目标分区 * param topic Topic名称 * param key 消息KeyJava对象未序列化 * param keyBytes 已序列化的Keybyte数组 * param value 消息Value未序列化 * param valueBytes 已序列化的Value * param cluster 集群元数据快照 * return 分区编号 */intpartition(Stringtopic,Objectkey,byte[]keyBytes,Objectvalue,byte[]valueBytes,Clustercluster);voidclose();}注意区分两个概念keyObject原始Key对象还没经过序列化keyBytesbyte[]已经序列化好的Key可直接用于Hash计算KafkaProducer调用时如果ProducerRecord指定了partition字段即record.partition() ! null就直接用指定的分区不会调用Partitioner。只有没指定分区时才会走Partitioner.partition()。三、DefaultPartitioner源码解析——经典的双模式策略3.1 核心源码publicclassDefaultPartitionerimplementsPartitioner{// Counter初始化为随机数避免重启后所有消息都去同一个分区privatefinalAtomicIntegercounternewAtomicInteger(newRandom().nextInt());// 并发安全的StickyPartition缓存privatefinalConcurrentMapString,IntegerstickyPartitionCachenewConcurrentHashMap();publicintpartition(Stringtopic,Objectkey,byte[]keyBytes,Objectvalue,byte[]valueBytes,Clustercluster){// 获取Topic的分区信息ListPartitionInfopartitionscluster.partitionsForTopic(topic);intnumPartitionspartitions.size();if(keyBytesnull){// 情况一消息没有Key —— Sticky分区策略(2.4)returnstickyPartitionCache.computeIfAbsent(topic,t-{// 先找可用分区有Leader的分区ListPartitionInfoavailablePartitionscluster.availablePartitionsForTopic(t);if(availablePartitions.isEmpty()){// 没有可用分区退化为RoundRobinintnextValuecounter.getAndIncrement();returnDefaultPartitioner.toPositive(nextValue)%numPartitions;}else{// 选择一个可用分区并粘住intpartDefaultPartitioner.toPositive(counter.getAndIncrement())%availablePartitions.size();returnavailablePartitions.get(part).partition();}});}else{// 情况二消息有Key —— Hash取模// murmur2是一种高效的、低碰撞率的哈希算法returnDefaultPartitioner.toPositive(Utils.murmur2(keyBytes))%numPartitions;}}// 将负数转为正数取绝对值的等价操作staticinttoPositive(intnumber){returnnumber0x7fffffff;}}3.2 两种策略图解【DefaultPartitioner 分区策略】消息有Key ──► murmur2(Key) % 分区数 ──► 固定分区相同Key → 相同分区 → 顺序保证消息无Key ──► Sticky策略 ──► 同一个批次粘在同一个可用分区 2.4 批次满后切换到新分区 ──► RoundRobin ──► counter % 分区数逐条轮询 2.3及之前无批量优化可能产生大量小批次3.3 为什么counter要用AtomicIntegerKafkaProducer是线程安全的多个业务线程可能同时调用send()。DefaultPartitioner必须也是线程安全的。这就是为什么用AtomicInteger而不是普通的int——两个线程并发调用counter.getAndIncrement()时不会出现计数错误。3.4 toPositive()方法负数转正数number 0x7fffffff这个位掩码操作是为了把负数转成正数。murmur2()可能返回负数因为返回类型是int包含符号位但分区编号必须是≥0的整数。负数: 1xxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx 掩码: 0xxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx ────────────────────────────────────────── 结果: 0xxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx ← 永远是正数四、Sticky Partitioner——2.4版本的性能优化利器4.1 问题老版本RoundRobin的痛点在Kafka 2.3及之前没有Key的消息使用RoundRobin策略——每条消息随机选一个分区。这会导致什么问题【RoundRobin策略产生大量小批次】 Topic: orders (3个分区) msg1 → P0 msg2 → P1 RecordAccumulator中的状态 msg3 → P2 P0: [msg1] ← 只有1条消息就凑满一个批次 msg4 → P0 P1: [msg2] ← 每条消息单独开Batch msg5 → P1 P2: [msg3] msg6 → P2 结果每个分区的Batch都只有少量消息 → 发送许多小请求 → 网络开销大4.2 Sticky策略的优化Sticky策略的思想是粘在同一个分区上直到当前Batch满了再换下一个分区。【Sticky策略批量优化效果】 msg1 → P0 msg2 → P0 ← 粘住P0 RecordAccumulator中的状态 msg3 → P0 ← 继续粘 P0: [msg1, msg2, msg3, msg4] ← 大Batch msg4 → P0 ← Batch满了 P1: [msg5, msg6, msg7] msg5 → P1 ← 切换到P1 P2: [msg8, msg9] msg6 → P1 msg7 → P1 msg8 → P2 msg9 → P2 结果每个分区攒了更大的Batch → 减少网络请求 → 吞吐量提升StickyPartitionCache的具体实现中就一个ConcurrentHashMapString, IntegerKey是Topic名Value是粘住的Partition编号。当Batch满了被Sender取走之后下次再append新消息时会重新选一个分区。4.3 对比总结对比维度RoundRobin (旧)Sticky (新,2.4)分区选择逐条轮询粘住分区Batch满后切换Batch填充率低每个分区各攒一点高每个分区攒满再走请求数量多小Batch多少大Batch少网络开销大小消息延迟低及时发送略高等待凑Batch适用场景低延迟要求高吞吐要求五、自定义分区器实战——按业务Key路由5.1 场景用户消息优先处理分区假设你有一个topic叫user-events有6个分区。你希望VIP用户的消息发往低编号分区P0-P1普通用户消息发往高编号分区P4-P5中间分区用于系统消息。/** * 自定义分区器VIP用户优先分区 * VIP用户 → P0, P1 * 系统消息 → P2, P3 * 普通用户 → P4, P5 */publicclassVipAwarePartitionerimplementsPartitioner{privatestaticfinalSetStringVIP_USERSnewHashSet(Arrays.asList(vip_001,vip_002,vip_003// VIP用户白名单));privatestaticfinalStringSYSTEM_KEY__SYSTEM__;Overridepublicintpartition(Stringtopic,Objectkey,byte[]keyBytes,Objectvalue,byte[]valueBytes,Clustercluster){ListPartitionInfopartitionscluster.partitionsForTopic(topic);intnumPartitionspartitions.size();// 把Key转成字符串StringkeyStr(keyBytes!null)?newString(keyBytes):;if(SYSTEM_KEY.equals(keyStr)){// 系统消息 → P2, P3// 用简单的随机分配intbase2;intoffsetThreadLocalRandom.current().nextInt(2);returnbaseoffset;}elseif(VIP_USERS.contains(keyStr)){// VIP用户 → P0, P1// 用Hash保证同一VIP用户消息有序inthashMath.abs(Utils.murmur2(keyBytes));returnhash%2;// P0或P1}else{// 普通用户 → P4, P5// 也用Hash同一用户的消息在同一分区inthashMath.abs(Utils.murmur2(keyBytes));return4(hash%2);// P4或P5}}Overridepublicvoidclose(){}Overridepublicvoidconfigure(MapString,?configs){}}5.2 配置使用PropertiespropsnewProperties();props.put(ProducerConfig.PARTITIONER_CLASS_CONFIG,com.example.VipAwarePartitioner);// 指定自定义分区器props.put(bootstrap.servers,localhost:9092);// ... 其他配置KafkaProducerString,StringproducernewKafkaProducer(props);// VIP用户消息自动路由到P0或P1producer.send(newProducerRecord(user-events,vip_001,VIP用户登录));// 普通用户消息自动路由到P4或P5producer.send(newProducerRecord(user-events,normal_user_123,普通用户点击));六、分区数与吞吐量的关系——数学不小了【分区数与吞吐量的关系图】吞吐量(TPS) ▲ │ ┌────────────────────── │ ┌─────┘ ← 达到瓶颈磁盘/网络 │ ┌─────┘ │ ┌────┘ ← 线性增长区间 │ ┌────┘ │ ┌──┘ └─┴────┬────┬────┬────┬────┬────┬────► 分区数 1 3 6 9 12 15 18 分区太少 ──► 无法充分利用集群能力分区太多 ──► 元数据开销大、文件句柄多、Leader选举慢经验法则分区数 max(总吞吐量需求 / 单分区吞吐量, 消费者实例数)单分区吞吐量一般~10MB/s 写~50MB/s 读分区总数所有Topic建议不超过Broker数量的4000倍七、分区器选型决策场景推荐策略配置需要消息顺序Key HashDefaultPartitioner 带Key的消息高吞吐、不关心顺序StickyDefaultPartitioner(默认)按业务规则路由自定义Partitionerpartitioner.classxxx指定分区发送直接指定分区ProducerRecord中指定partition均匀分布无Key消息RoundRobin需实现自定义Partitioner本篇小结分区器看似简单实则内涵丰富DefaultPartitioner是双模式有Key走murmur2哈希保证同Key顺序无Key走Sticky保证批量效率。Kafka 2.4的Sticky优化是一个典型的用稍高延迟换更高吞吐的trade-off案例自定义分区器的关键是理解输入参数——你拿到的是已序列化的keyBytes和集群元数据足以实现任意复杂的分区逻辑分区数量不是越多越好需要根据吞吐量需求和消费者并发数综合计算尽量让分区在各个Broker上均匀分布避免热点——下一篇我们讲集群元数据看看Producer是怎么知道这些拓扑信息的上一篇【第13篇】Kafka序列化器深度解析——自定义Serializer不再是难题下一篇【第15篇】Kafka集群元数据源码解析——生产者如何认识整个集群

YOLOv5m训练VisDrone2019实战：从环境配置到模型部署的完整Pipeline（含WandB可视化）

YOLOv5m训练VisDrone2019全流程实战：从环境配置到模型部署的工程化实践无人机航拍图像的目标检测一直是计算机视觉领域的热点应用场景。VisDrone2019作为当前最权威的无人机视角数据集，包含了10个类别的密集小目标检测任务，对模型的精度和效…

2026/6/8 12:07:59 阅读更多

别再手动采样了！用ArcGIS的‘创建随机点’和‘按点提取值’工具，5分钟自动化你的环境数据收集

空间采样革命：ArcGIS随机点生成与多源数据自动化采集实战在环境监测、生态调查和遥感验证等场景中，科学布设采样点并高效采集空间数据一直是困扰研究人员的难题。传统人工采样不仅耗时费力，还难以保证空间分布的均匀性和统计代表性。ArcGIS平…

2026/6/8 12:07:38 阅读更多

MPC5777C双核AUTOSAR项目实战：启动文件与链接脚本配置详解

1. 项目概述：从单核到双核的嵌入式系统跃迁在汽车电子和工业控制领域，随着功能安全（如ISO 26262）和复杂功能（如高级驾驶辅助系统ADAS）需求的激增，单核微控制器（MCU）的处理…

2026/6/8 12:06:36 阅读更多

小学期学习——第四周

2026/6/8 13:20:49 阅读更多

052、Varifocal Loss：IoU-Aware 分类分数设计的完整公式与代码

052、Varifocal Loss：IoU-Aware 分类分数设计的完整公式与代码去年夏天调一个密集行人检测模型，mAP卡在0.52死活上不去。可视化发现大量预测框分类分数虚高——明明IoU只有0.3，分类头却打出0.9的置信度。后来翻到Varifocal Loss的论文&#x…

2026/6/8 13:20:49 阅读更多

从零构建算术表达式编译器：Python实现词法分析、语法树与解释器

1. 项目概述：为什么我们要亲手“造轮子”？如果你已经写过不少代码，可能偶尔会好奇：我写的print("Hello, World")，电脑的CPU到底是怎么看懂并执行的呢？中间到底发生了什么？编译器&…

2026/6/8 13:20:49 阅读更多

Web Components主题热切换方案揭秘

发散创新：用 adoptedStyleSheets Constructable Stylesheets 实现 Web Components 的主题热切换系统在现代 Web Components 开发中，样式隔离与主题动态切换长期存在矛盾：Shadow DOM 天然阻断全局样式穿透，但传统 <link rel&…

2026/6/8 13:20:28 阅读更多

MIFARE Ultralight AES安全芯片：低成本应用的AES-128与CMAC实战指南

1. 项目概述与核心价值如果你正在设计一个基于NFC的票务、门禁或者物流追踪系统，并且对成本敏感，但又不能完全牺牲安全性，那么MIFARE Ultralight AES这颗芯片很可能已经进入了你的备选清单。它不像它的“大哥”MIFARE DESFire那样拥有复杂的文…

2026/6/8 13:20:28 阅读更多

Audacity音频编辑完全指南：从零基础到专业实战

Audacity音频编辑完全指南：从零基础到专业实战【免费下载链接】audacity Audio Editor 项目地址: https://gitcode.com/GitHub_Trending/au/audacity 想要轻松处理音频却不知从何入手？Audacity作为业界知名的开源音频编辑神器，为您提…

2026/6/8 13:20:08 阅读更多

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现【免费下载链接】amlogic-s9xxx-armbian Supports running Armbian on Amlogic, Allwinner, and Rockchip devices. Support a311d, s922x, s905x3, s905x2, s912, s905d, s905x, …

2026/6/8 0:00:25 阅读更多

Python Scrapy 爬虫实战进阶系列（一）：轻量化数据存储 - 数据精准写入 SQLite 数据库

前言在 Python 爬虫开发领域中，Scrapy 作为高性能、高可扩展性的异步爬虫框架，是行业内采集结构化数据的首选工具。在中小型爬虫项目、本地数据采集、轻量化数据存储场景中，SQLite 无需独立服务、单文件存储、原生兼容 Python 的特性&#…

2026/6/8 0:00:45 阅读更多

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案【免费下载链接】btrfs WinBtrfs - an open-source btrfs driver for Windows 项目地址: https://gitcode.com/gh_mirrors/bt/btrfs 还在为Windows无法访问Linux Btrfs分区而烦恼吗？你是…

2026/6/8 0:03:08 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/8 0:06:11 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/8 0:06:11 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/8 0:06:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/8 9:43:25 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/8 9:43:23 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/8 9:43:30 阅读更多

相关文章

YOLOv5m训练VisDrone2019实战：从环境配置到模型部署的完整Pipeline（含WandB可视化）

别再手动采样了！用ArcGIS的‘创建随机点’和‘按点提取值’工具，5分钟自动化你的环境数据收集

MPC5777C双核AUTOSAR项目实战：启动文件与链接脚本配置详解

小学期学习——第四周

052、Varifocal Loss：IoU-Aware 分类分数设计的完整公式与代码

从零构建算术表达式编译器：Python实现词法分析、语法树与解释器

Web Components主题热切换方案揭秘

MIFARE Ultralight AES安全芯片：低成本应用的AES-128与CMAC实战指南

Audacity音频编辑完全指南：从零基础到专业实战

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现

Python Scrapy 爬虫实战进阶系列（一）：轻量化数据存储 - 数据精准写入 SQLite 数据库

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因