深入解析 TiDB 分布式架构：三大核心组件与底层运行原理

发布时间：2026/6/1 14:27:34

TiDB 是一款兼容 MySQL 协议的分布式关系型数据库整体架构由PD 集群、KV 集群、TiDB Server无状态节点三大核心模块组成。三者分工明确、协同工作依托 Raft 共识算法实现高可用、强一致性与弹性扩缩容下面从组件功能、实操演示、底层算法、架构优势等维度全面拆解。一、PDPlacement Driver集群集群全局管控核心PD 是 TiDB 的 “大脑”主要负责存储、管理数据库运行所需的系统级元数据统筹整个集群的调度、路由与全局管控。在架构交互上PD 会与上层 SQL 层集群交互时间戳、数据位置信息同时和下层 KV 集群同步元数据核心能力分为三部分1. TSOTimestamp Oracle时间戳授时器TSO 是实现分布式强一致性事务的核心组件可直译为时间戳授时器。TiDB 支持强一致性分布式事务必须精准判定所有操作的先后顺序。即便数据库无任何数据变更PD 也会持续生成单调递增的时间戳。当服务端发起事务、执行数据修改时都需要向 PD 申请最新 TSO。依靠全局统一的时间戳分布式集群会形成有序时间流以此支撑多版本并发控制MVCC等事务核心能力。补充说明此处的 Oracle 仅代表 “权威授时节点”和商用 Oracle 数据库无任何关联。2. Data Location 数据位置路由TiDB 服务端执行 SQL 查询时并不清楚数据的实际存储节点该路由工作由 PD 全权负责。TiDB 会将数据表的数据行Row拆分存储在一个个Region数据分片中PD 全局维护映射关系某条数据归属哪个 Region、该 Region 部署在哪台存储节点。简单来说PD 就是整个集群的数据路由中心Region 相关细节后文会详细介绍。3. Metadata 集群元数据管理PD 统一管理集群各类管理型元数据。典型场景在 TiDB 中新建数据表时表的全局唯一编号由 PD 统一分配。除此之外数据库对象标识、集群配置等管理类信息均由 PD 维护。综上PD 集群承载 TiDB 所有系统级能力与管控数据而用户创建的表、索引等业务数据则全部存储在 KV 集群中。二、KV 集群分布式数据存储引擎KV 集群本质是一套分布式键值Key-Value数据库属于标准 NoSQL 组件原生提供 KV 读写接口也是 TiDB 真正落地业务数据的存储层。上层 SQL 层会将用户输入的 SQL 语句转译为底层 KV 操作再调用 KV 集群接口完成数据存取。KV 集群本身无法解析 SQL 语法仅识别键值对格式数据所有读写操作都基于 Key-Value 实现。本地环境实操演示为直观理解 KV 集群的交互逻辑我们在单机搭建测试环境进行演示集群部署说明本次演示将 PD、KV 部署在同一台机器方便调试生产环境严禁混部需将两类组件拆分部署至不同服务器保障资源隔离与高可用。目前集群所有服务已正常启动。客户端使用提醒测试使用的 Python 版 KV 客户端模块仅适用于演示场景功能与稳定性不达标禁止在生产环境使用。集群连接调用连接函数时传入任意一个 PD 节点的访问地址Endpoint即可建立连接多 PD 节点能力对等。数据读写KV 集群仅接收字节流bytes格式数据。写入时构造 Key-Value 键值对读取时通过指定 Key 即可查询对应 Value全程仅基于键值对交互不识别 SQL。有状态集群与 Raft 容错算法PD 集群与 KV 集群都属于Stateful有状态集群节点会在本地磁盘持久化数据。很多人会产生疑问如果节点宕机、甚至彻底损坏数据是否会丢失答案是否定的核心保障就是Raft 共识算法。Raft 是主流分布式共识算法作用是保证多副本数据的完整性与一致性核心遵循多数派原则。1. Raft 在 PD 集群中的应用生产环境 PD 一般部署 3 个节点数据默认保存 3 份副本并分散至所有 PD 节点。角色划分同一时刻集群内仅有一个 Leader 主节点其余为 Follower 从节点写入规则数据成功写入超过半数节点3 节点集群至少写入 2 个即判定写入完成故障自愈单个从节点宕机不影响服务若 Leader 节点故障剩余存活节点会自动重新选举新 Leader集群无感知切换。2. Raft 在 KV 集群中的应用KV 集群同样使用 Raft 算法但共识单元不同PD 以整节点为单位达成共识KV 则以Region数据分片为最小共识单元。分片规则TiDB 默认单个 Region 大小为 96MB每个 Region 配置 3 份副本分散在不同 KV 节点上角色机制单个 Region 内部同样区分 Leader 与 Follower遵循 Raft 多数派原则灵活配置KV 集群可包含大量节点但单个 Region 仅占用 3 台节点存放副本副本数量支持自定义调整。分片数量估算以 100TB 业务数据为例按照默认 96MB/Region 计算分片总量单位换算\(100\ \text{TB} 100 \times 1024 \times 1024 104857600\ \text{MB}\)Region 总数\(104857600 \div 96 \approx 1092267\)由此可得100TB 数据按照默认规则拆分约产生109 万个 Region 分片。海量轻量化分片也是 TiDB 实现数据均衡调度、分布式存储的基础。三、TiDB Server无状态 SQL 接入层TiDB Server 属于Stateless无状态节点也是用户访问数据库的入口。该节点不存储任何系统数据与业务数据核心职责是对外提供兼容 MySQL 的访问接口。用户提交的 SQL 语句全部由 TiDB Server 接收完成语法解析、生成执行计划并将 SQL 逻辑转译为底层可执行指令下发给 KV 存储层完成数据读写。四、TiDB 整体架构优势与扩缩容能力整套 TiDB 由「有状态 PDKV 集群」「无状态 TiDB Server」组成架构不依赖共享存储全部使用本地磁盘Local Storage所有组件均支持横向线性扩缩容可根据业务压力灵活调整资源特性类似微服务架构。1. 各组件扩缩容规则PD 集群负载过高时新增节点即可。受 Raft 多数派协议约束节点总数建议设置为奇数保证选举与数据一致性正常运行。KV 集群当存储容量不足、读写算力吃紧时新增 KV 节点即可分担压力数据会自动完成分片迁移与均衡Region 副本数同样建议配置为奇数。TiDB Server作为计算接入层若 SQL 请求量大、响应变慢直接增加节点业务低峰、资源闲置时可下线节点释放资源。2. 架构设计核心特点TiDB 整套架构的设计理念处处体现负载均衡思想。我们可以将它理解为一台强化型负载均衡器在实现分布式数据存储、强一致性事务处理的基础上原生兼容 MySQL 协议兼顾分布式数据库的高性能、高可用与传统关系型数据库的使用习惯这也是 TiDB 最核心的设计亮点。总结PD 集群全局管控中心负责授时、路由、元数据管理KV 集群底层存储引擎基于键值对存储业务数据依托 Region 分片 Raft 算法实现高可用TiDB ServerSQL 接入网关无状态设计负责语句解析与请求转发。三大组件各司其职、配合默契结合本地存储、线性扩缩容、Raft 强一致性等特性让 TiDB 成为适配海量数据、高并发场景的主流分布式数据库。官网资料学习整理原视频地址如下TIDB架构与特点-01TIDB整体架构https://learn.pingkai.cn/learner/player/630005;id630005;classroomId960002;rcoId1080432;courseDetailId600003;learnerAttemptId1780236619005

Sora 2字幕添加即刻生效方案：3行Python脚本自动校准SRT时间轴+强制触发Sora v2.3字幕重载协议

更多请点击： https://intelliparadigm.com 第一章：Sora 2字幕添加方法 Sora 2 是一款面向视频创作者的智能字幕生成与编辑工具，其字幕添加流程兼顾自动化与精细化控制。用户可通过本地文件导入或实时录制两种方式触发字幕生成，并…

2026/6/1 14:26:53 阅读更多

[Windows] 屏幕亮度调节工具

【应用名称】：[Windows] 屏幕亮度调节工具【应用版本】：1.55 【应用大小】：146 KB 【应用介绍】：Brightness.Manager.OK 是一款Windows 专用、轻量免安装的屏幕亮度调节小工具，专门解决台式机、部分笔记本…

2026/6/1 14:25:32 阅读更多

在Ubuntu 20.04上搞定ORB-SLAM3编译：一个C++14标准设置救了我的命

在Ubuntu 20.04上搞定ORB-SLAM3编译：一个C14标准设置救了我的命如果你正在Ubuntu 20.04上尝试编译ORB-SLAM3，却在make阶段被一连串错误 1卡住，这篇文章就是为你准备的。作为一个在计算机视觉领域深耕多年的开发者，我深知这种看似简…

2026/6/1 14:25:32 阅读更多

WinUtil：3分钟解决Windows系统优化的完整免费方案

WinUtil：3分钟解决Windows系统优化的完整免费方案【免费下载链接】winutil Chris Titus Techs Windows Utility - Install Programs, Tweaks, Fixes, and Updates 项目地址: https://gitcode.com/GitHub_Trending/wi/winutil 还在为Windows系统繁琐的优化和…

2026/6/1 19:17:27 阅读更多

2026硬核避坑：多款AI消痕降AIGC率工具实测，网文长篇怎么选？

2026硬核避坑：多款AI消痕降AIGC率工具实测，网文长篇怎么选？ 说实话，2026年了，网文圈里要是谁还敢把 AI 生成的初稿直接复制贴进存稿箱，那我只能祝你早日跟封号握手言和。现在的编辑和平台检测算法贼精&a…

2026/6/1 19:16:46 阅读更多

Sora 2实时渲染交互瓶颈突破：GPU内存占用降低63%的关键3步调优法（附NVidia CUDA Profile诊断模板）

更多请点击： https://kaifayun.com 第一章：Sora 2交互设计演示 Sora 2 是新一代基于多模态理解的交互式生成平台，其交互设计强调低延迟响应、上下文感知与自然语言驱动的可视化操作闭环。用户可通过统一 Web 控制台实时调整生成参数、注入结…

2026/6/1 19:16:46 阅读更多

企业级Sora 2虚拟会议背景私有化部署失败率高达67%？20年音视频架构师亲授5层网络拓扑校验法

更多请点击： https://kaifayun.com 第一章：企业级Sora 2虚拟会议背景私有化部署失败率高达67%？ 近期多家头部金融与制造企业在尝试将Sora 2虚拟会议系统私有化部署至本地Kubernetes集群时，遭遇显著落地障碍。据第三方IT治理平台《…

2026/6/1 19:16:26 阅读更多

Sora 2生物动画生成：3大颠覆性突破+5个未公开训练范式，生物仿真精度提升47%（Nature子刊级验证）

更多请点击： https://codechina.net 第一章：Sora 2生物动画生成：从概念到范式跃迁 Sora 2并非简单迭代，而是将生物运动建模从“帧间插值”推向“神经生理驱动”的关键跃迁。其核心突破在于引入多尺度生物动力学先验（B…

2026/6/1 19:16:06 阅读更多

AIGC视频时代已来，你的品牌还在用传统脚本？：Sora 2官方未公布的7个合规性避坑清单

更多请点击： https://kaifayun.com 第一章：AIGC视频时代已来，你的品牌还在用传统脚本？ 当Stable Video Diffusion 1.0发布、Sora开启长时序建模新范式、Pika与Runway持续迭代多轮生成能力，AIGC视频已从“能出画面”迈…

2026/6/1 19:15:25 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/1 0:00:11 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/1 0:03:17 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/1 0:06:19 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/1 0:24:01 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/1 2:19:25 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/1 0:23:56 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

2026/6/1 0:00:11 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

2026/6/1 0:03:17 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

2026/6/1 0:06:19 阅读更多

相关文章

Sora 2字幕添加即刻生效方案：3行Python脚本自动校准SRT时间轴+强制触发Sora v2.3字幕重载协议

[Windows] 屏幕亮度调节工具

在Ubuntu 20.04上搞定ORB-SLAM3编译：一个C++14标准设置救了我的命

WinUtil：3分钟解决Windows系统优化的完整免费方案

2026硬核避坑：多款AI消痕降AIGC率工具实测，网文长篇怎么选？

Sora 2实时渲染交互瓶颈突破：GPU内存占用降低63%的关键3步调优法（附NVidia CUDA Profile诊断模板）

企业级Sora 2虚拟会议背景私有化部署失败率高达67%？20年音视频架构师亲授5层网络拓扑校验法

Sora 2生物动画生成：3大颠覆性突破+5个未公开训练范式，生物仿真精度提升47%（Nature子刊级验证）

AIGC视频时代已来，你的品牌还在用传统脚本？：Sora 2官方未公布的7个合规性避坑清单

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因