从零实现一个分布式消息中间件：Kafka核心设计

发布时间：2026/6/27 1:26:20

前言你有没有想过每天处理万亿级消息的Kafka它的核心设计到底是什么为什么它能做到高吞吐、低延迟、持久化、有序消费今天我们从零实现一个简化版Kafka· 消息存储日志分段索引· 生产者消息追加· 消费者偏移量管理· 分区Partition与副本Replica· 消费组Consumer Group---一、Kafka核心原理1. 架构图┌─────────────────────────────────────────────────────────────┐│ Kafka集群 ││ ┌─────────┐ ┌─────────┐ ┌─────────┐ ││ │ Broker1 │ │ Broker2 │ │ Broker3 │ ││ │ Topic-A │ │ Topic-A │ │ Topic-B │ ││ │ Partition│ │ Partition│ │ Partition│ ││ │ 0 │ │ 1 │ │ 0 │ ││ └─────────┘ └─────────┘ └─────────┘ │└─────────────────────────────────────────────────────────────┘│ │ │▼ ▼ ▼┌─────────┐ ┌─────────┐ ┌─────────┐│ 生产者 │ │ 消费者1 │ │ 消费者2 ││ (Producer)│ │ (Group1)│ │ (Group2)│└─────────┘ └─────────┘ └─────────┘2. 核心概念概念说明Broker Kafka节点Topic 消息主题Partition 分区顺序读写Offset 消息偏移量Consumer Group 消费者组组内竞争Log Segment 日志分段文件---二、完整代码实现1. 基础数据结构c#include stdio.h#include stdlib.h#include string.h#include unistd.h#include pthread.h#include time.h#include errno.h#include sys/stat.h#include fcntl.h#include dirent.h#define MAX_TOPICS 100#define MAX_PARTITIONS 100#define MAX_MSG_SIZE 65536#define MAX_BATCH_SIZE 1000#define SEGMENT_SIZE 1024 * 1024 // 1MB// 消息结构typedef struct kafka_message {long long offset;long long timestamp;int key_len;char *key;int value_len;char *value;} kafka_message_t;// 分区typedef struct partition {int id;char topic[64];int leader; // 分区Leaderlong long log_end_offset; // 最新偏移量long long log_start_offset; // 最早偏移量char *segment_file; // 当前日志文件int segment_fd;pthread_mutex_t mutex;struct partition *next;} partition_t;// 主题typedef struct topic {char name[64];partition_t *partitions;int partition_count;int replication_factor;struct topic *next;} topic_t;// 消费者偏移量typedef struct consumer_offset {char group_id[64];char topic[64];int partition_id;long long offset;struct consumer_offset *next;} consumer_offset_t;// Kafka Brokertypedef struct kafka_broker {int broker_id;char data_dir[256];topic_t *topics;consumer_offset_t *offsets;pthread_mutex_t mutex;int port;int running;} kafka_broker_t;2. 日志存储c// 创建Brokerkafka_broker_t *broker_create(int broker_id, const char *data_dir, int port) {kafka_broker_t *b malloc(sizeof(kafka_broker_t));memset(b, 0, sizeof(kafka_broker_t));b-broker_id broker_id;strcpy(b-data_dir, data_dir);b-port port;b-running 1;pthread_mutex_init(b-mutex, NULL);// 创建数据目录mkdir(data_dir, 0755);printf(Kafka Broker %d 启动数据目录: %s\n, broker_id, data_dir);return b;}// 创建分区日志文件int partition_create_log(partition_t *p) {char path[512];snprintf(path, sizeof(path), ./data/%s-%d.log, p-topic, p-id);p-segment_file strdup(path);p-segment_fd open(path, O_RDWR | O_CREAT | O_APPEND, 0644);if (p-segment_fd 0) return -1;// 获取当前文件大小p-log_end_offset lseek(p-segment_fd, 0, SEEK_END) / sizeof(long long);return 0;}// 创建分区partition_t *partition_create(int id, const char *topic) {partition_t *p malloc(sizeof(partition_t));memset(p, 0, sizeof(partition_t));p-id id;strcpy(p-topic, topic);p-leader 1;p-log_end_offset 0;p-log_start_offset 0;pthread_mutex_init(p-mutex, NULL);partition_create_log(p);return p;}// 追加消息到分区int partition_append_message(partition_t *p, const char *key, int key_len,const char *value, int value_len, long long *offset) {pthread_mutex_lock(p-mutex);// 构造消息简化直接写入// 格式: offset|timestamp|key_len|key|value_len|valuechar msg_buf[MAX_MSG_SIZE];int msg_len snprintf(msg_buf, sizeof(msg_buf),%lld|%lld|%d|%s|%d|%s,p-log_end_offset, (long long)time(NULL),key_len, key ? key : ,value_len, value ? value : );// 写入文件int written write(p-segment_fd, msg_buf, msg_len);if (written 0) {pthread_mutex_unlock(p-mutex);return -1;}*offset p-log_end_offset;p-log_end_offset;// 检查是否达到分段大小if (lseek(p-segment_fd, 0, SEEK_CUR) SEGMENT_SIZE) {// 滚动新文件close(p-segment_fd);free(p-segment_file);partition_create_log(p);}pthread_mutex_unlock(p-mutex);return 0;}3. 主题与分区管理c// 创建主题topic_t *broker_create_topic(kafka_broker_t *b, const char *name,int partitions, int replication_factor) {pthread_mutex_lock(b-mutex);topic_t *t malloc(sizeof(topic_t));strcpy(t-name, name);t-partition_count partitions;t-replication_factor replication_factor;t-partitions NULL;// 创建分区for (int i 0; i partitions; i) {partition_t *p partition_create(i, name);p-next t-partitions;t-partitions p;}t-next b-topics;b-topics t;pthread_mutex_unlock(b-mutex);printf([Kafka] 创建主题: %s (分区: %d, 副本: %d)\n, name, partitions, replication_factor);return t;}// 获取分区轮询partition_t *broker_get_partition(kafka_broker_t *b, const char *topic,long long key_hash) {pthread_mutex_lock(b-mutex);topic_t *t b-topics;while (t) {if (strcmp(t-name, topic) 0) {// 根据哈希选择分区int idx key_hash % t-partition_count;partition_t *p t-partitions;for (int i 0; i idx p; i) {p p-next;}pthread_mutex_unlock(b-mutex);return p;}t t-next;}pthread_mutex_unlock(b-mutex);return NULL;}4. 消费者偏移量c// 更新偏移量int broker_update_offset(kafka_broker_t *b, const char *group_id,const char *topic, int partition_id, long long offset) {pthread_mutex_lock(b-mutex);consumer_offset_t *co b-offsets;while (co) {if (strcmp(co-group_id, group_id) 0 strcmp(co-topic, topic) 0 co-partition_id partition_id) {co-offset offset;pthread_mutex_unlock(b-mutex);return 0;}co co-next;}// 新建偏移量co malloc(sizeof(consumer_offset_t));strcpy(co-group_id, group_id);strcpy(co-topic, topic);co-partition_id partition_id;co-offset offset;co-next b-offsets;b-offsets co;pthread_mutex_unlock(b-mutex);return 0;}// 获取偏移量long long broker_get_offset(kafka_broker_t *b, const char *group_id,const char *topic, int partition_id) {pthread_mutex_lock(b-mutex);consumer_offset_t *co b-offsets;while (co) {if (strcmp(co-group_id, group_id) 0 strcmp(co-topic, topic) 0 co-partition_id partition_id) {long long offset co-offset;pthread_mutex_unlock(b-mutex);return offset;}co co-next;}pthread_mutex_unlock(b-mutex);return 0; // 从头消费}5. 生产者c// 生产者typedef struct kafka_producer {kafka_broker_t *broker;char topic[64];int partition_id;int ack_level; // 0: 不等待, 1: Leader确认, -1: 所有副本确认} kafka_producer_t;kafka_producer_t *producer_create(kafka_broker_t *b, const char *topic) {kafka_producer_t *p malloc(sizeof(kafka_producer_t));p-broker b;strcpy(p-topic, topic);p-partition_id -1; // -1表示自动选择p-ack_level 1;return p;}// 发送消息int producer_send(kafka_producer_t *p, const char *key, const char *value) {partition_t *partition NULL;if (p-partition_id 0) {// 指定分区topic_t *t p-broker-topics;while (t) {if (strcmp(t-name, p-topic) 0) {partition_t *part t-partitions;for (int i 0; i p-partition_id part; i) {part part-next;}partition part;break;}t t-next;}} else {// 自动选择轮询或哈希long long hash key ? strhash(key) : rand();partition broker_get_partition(p-broker, p-topic, hash);}if (!partition) {printf([生产者] 分区不存在\n);return -1;}long long offset;int ret partition_append_message(partition, key, key ? strlen(key) : 0,value, strlen(value), offset);if (ret 0) {printf([生产者] 发送消息: key%s, value%s, offset%lld\n,key ? key : null, value, offset);}return ret;}// 字符串哈希unsigned long strhash(const char *str) {unsigned long hash 5381;int c;while ((c *str)) {hash ((hash 5) hash) c;}return hash;}6. 消费者c// 消费者typedef struct kafka_consumer {kafka_broker_t *broker;char group_id[64];char topic[64];int partition_id;long long current_offset;int running;pthread_t thread;void (*callback)(kafka_message_t *msg);} kafka_consumer_t;kafka_consumer_t *consumer_create(kafka_broker_t *b, const char *group_id,const char *topic, int partition_id) {kafka_consumer_t *c malloc(sizeof(kafka_consumer_t));c-broker b;strcpy(c-group_id, group_id);strcpy(c-topic, topic);c-partition_id partition_id;c-running 1;c-callback NULL;// 获取上次偏移量c-current_offset broker_get_offset(b, group_id, topic, partition_id);printf([消费者] 创建: group%s, topic%s, partition%d, offset%lld\n,group_id, topic, partition_id, c-current_offset);return c;}// 消费者工作线程void *consumer_worker(void *arg) {kafka_consumer_t *c (kafka_consumer_t*)arg;while (c-running) {// 获取分区partition_t *partition broker_get_partition(c-broker, c-topic, c-partition_id);if (!partition) {usleep(100000);continue;}pthread_mutex_lock(partition-mutex);// 检查是否有新消息if (c-current_offset partition-log_end_offset) {// 读取消息简化直接从文件读取char line[4096];lseek(partition-segment_fd, 0, SEEK_SET);// 跳过已消费的消息long long skip c-current_offset;while (skip 0 fgets(line, sizeof(line), partition-segment_fd)) {skip--;}if (fgets(line, sizeof(line), partition-segment_fd)) {// 解析消息kafka_message_t msg;// 简化解析// ...msg.offset c-current_offset;if (c-callback) {c-callback(msg);}c-current_offset;broker_update_offset(c-broker, c-group_id, c-topic,c-partition_id, c-current_offset);}}pthread_mutex_unlock(partition-mutex);usleep(10000);}return NULL;}void consumer_start(kafka_consumer_t *c) {pthread_create(c-thread, NULL, consumer_worker, c);}void consumer_stop(kafka_consumer_t *c) {c-running 0;pthread_join(c-thread, NULL);}7. 测试代码cvoid test_kafka() {printf( Kafka核心实现测试 \n\n);// 创建Brokerkafka_broker_t *broker broker_create(1, ./data, 9092);// 创建主题broker_create_topic(broker, test-topic, 3, 1);// 生产者kafka_producer_t *producer producer_create(broker, test-topic);// 发送消息printf(\n--- 发送消息 ---\n);for (int i 0; i 10; i) {char key[32], value[64];snprintf(key, sizeof(key), key-%d, i);snprintf(value, sizeof(value), Hello Kafka %d, i);producer_send(producer, key, value);usleep(10000);}// 消费者printf(\n--- 消费消息 ---\n);kafka_consumer_t *consumer consumer_create(broker, group-1, test-topic, 0);consumer-callback (void(*)(kafka_message_t*)) [](kafka_message_t *msg) {printf([消费者] offset%lld, value%s\n, msg-offset, (char*)msg-value);};consumer_start(consumer);sleep(2);consumer_stop(consumer);printf(\n测试完成\n);}int main() {srand(time(NULL));test_kafka();return 0;}---三、编译和运行bashgcc -o kafka kafka.c -lpthread./kafka---四、Kafka vs 本实现特性本实现 Kafka消息存储文件顺序日志文件分区 ✅ ✅副本 ❌ ✅消费组 ✅ ✅消息压缩 ❌ ✅事务 ❌ ✅高吞吐 ✅ 基础 ✅ 极高性能---五、总结通过这篇文章你学会了· Kafka的核心设计日志分段、分区、偏移量· 消息的存储与索引· 生产者消息追加· 消费者偏移量管理· 消费组的实现Kafka是消息中间件的经典之作。掌握它你就理解了万亿级消息处理系统的核心设计。下一篇预告《从零实现一个分布式数据库LSM树存储引擎》---评论区分享一下你用Kafka解决过什么场景

JAVA——线程池

设计模式学习（五）装饰者模式、桥接模式、外观模式MCP之如何调试MCP ServerMac添加全局变量Java基础（①Tomcat Servlet JSP）前端-JS基础-day4深入了解linux网络—— 基于UDP实现翻译和聊天功能Qt 按钮点击事件全链路解析&#xff1…

2026/6/27 1:25:39 阅读更多

MySQL JSON 数据类型用法及与传统JSON字符串的对比 JSON数据类型简介

Django之APPEND_SLASH配置爬坑Spring boot 学习记录大数据学习之路【Ubuntu 20.04升级python3.9后终端打不开的bug】stp root primary 概念及题目Xrdp 远程桌面配置【笔记】【LLaMA-Factory 实战系列】二、WebUI 篇 - Qwen2.5-VL 多模态模型 LoRA 微调保姆级教程线性代数矩阵…

2026/6/27 1:25:19 阅读更多

《嵌入式驱动（四）：设备树》

Go基础：正则表达式 regexp 库详解增强版 bash “zsh“Pytorch强化学习demo安全初级（二）HTTPGo语言select调度机制全解析：从原理到饥饿问题再到公平分发uniapp 自定义组件库内样式微信小程序端不生效解决Codeforces Beta Round 1 …

2026/6/27 1:25:19 阅读更多

AI 生成的 Excel 导入并行化方案，为什么“成功条数”经常对不上

文件导入功能看起来通常不复杂。用户上传一份 Excel，系统读取每一行，校验字段，再把有效数据写入数据库。数据量少时，一条条处理也许没问题；当文件变成几千行、几万行，开发者自然会想到并行化。于是&#…

2026/6/27 3:14:47 阅读更多

AI应用工程师 02

概述大模型缺陷Agent解决方案只能聊天会执行任务不会调用APITool Calling不会长期记忆Memory不会拆解任务Planning不会纠错Reflection不会跨系统操作Workflow不会自主查资料Agentic RAG不会使用软件Computer Use用户： 分析上个月销售数据Agent:Step1 调SQL工具Step2…

2026/6/27 3:12:46 阅读更多

3D IC与3D Chiplet

过去半个多世纪，半导体行业一直仰赖摩尔定律的平面微缩来驱动性能提升——每一代新节点都带来晶体管密度翻倍、性能提升与成本下降。然而，当制程节点推进到5nm以下时，光刻极限、互连瓶颈和热问题使得传统平面微缩的收益逐步递减。与此同时&am…

2026/6/27 3:12:46 阅读更多

笔记本电脑上，Edge浏览器用不了，而夸克浏览器能正常使用，解决这一问题的方法。

第一步：彻底重置电脑网络右键左下角开始菜单，选择「Windows终端(管理员)」依次输入下面两行，输一行按一次回车： netsh winsock reset netsh int ip reset 输完之后重启电脑第二步：设置开机自动修复键盘按 Win S&a…

2026/6/27 3:12:25 阅读更多

从零构件python接口自动化测试框架：Requests + Pytest + YAML + JSON Schema + Logging + Allure

在现代软件开发中，接口测试是保障系统质量的关键防线。比起繁琐的 UI 自动化，接口自动化执行速度快、稳定性高、更容易集成到 CI/CD 流程中。今天，我们将通过 Python 语言，结合目前业内最主流的技术栈：Requests Pytes…

2026/6/27 3:12:05 阅读更多

别了 ORM

别了 ORM 2026-06-26 一、ORM：人类的拐杖，AI 的枷锁对象关系映射（ORM）统治了软件开发很多年。开发者用 user.save() 代替 INSERT，用延迟加载代替 JOIN，用脏检查代替显式的 UPDATE。这套抽象在"减少样…

2026/6/27 3:12:05 阅读更多

千问AI眼镜：阿里AI战略急先锋，能否在激烈竞争中突围？

千问眼镜：销量第一背后的挑战不久前，不少第三方统计机构给千问背书，甚至给出全国销量第一的统计结果。这个第一的含金量有多高？暂且先打个问号。但这些榜单至少说明，千问眼镜延续了阿里AI战略整体偏激进的风格&#xf…

2026/6/27 0:01:13 阅读更多

Tomcat中X-Frame-Options配置实战：防御点击劫持的四种方法与最佳实践

1. 项目概述：为什么X-Frame-Options是Web安全的“防盗门”？最近在排查一个老项目的安全审计报告时，又被提到了“点击劫持”风险，矛头直指缺失的X-Frame-Options响应头。这已经不是第一次了，很多开发团队，尤…

2026/6/27 0:01:34 阅读更多

10分钟AI语音克隆与实时变声：Retrieval-based-Voice-Conversion-WebUI完整指南

10分钟AI语音克隆与实时变声：Retrieval-based-Voice-Conversion-WebUI完整指南【免费下载链接】Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data < 10 mins! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrie…

2026/6/27 0:04:02 阅读更多

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/27 1:16:50 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗？diff-pdf这款开…

2026/6/27 1:16:49 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/27 1:16:48 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/26 12:42:30 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…