一文搞定MySQL索引原理(让你拷打面试官，索引失效再也难不倒你)

发布时间：2026/6/11 7:49:04

B 树的存储规则主要围绕平衡性、阶数m、节点分裂与合并来组织数据确保查询、插入和删除的高效性。核心规则如下1. 节点类型与存储内容叶子节点存储所有数据记录或指向数据的指针并通过双向链表相连。叶子节点内键值按升序排列。内部节点非叶子只存储键和指向子节点的指针不存储数据。键用于路由指引搜索路径。2. 阶数 m 决定容量约束一棵 m 阶 B 树m ≥ 3需满足每个节点最多有 m 个孩子→ 最多存 m-1 个键。除根节点外每个节点至少 ⌈m/2⌉ 个孩子→ 至少存 ⌈m/2⌉ - 1 个键。根节点至少 2 个孩子除非树为空或只有一个节点。例如 m5五阶树非根节点至少有 3 个孩子含 2 个键最多 5 个孩子含 4 个键。根节点至少有 2 个孩子最多 5 个孩子。3. 键的分布与重复规则内部节点的键是其子树中最小键的副本或最大键的副本取决于实现用于分叉决策。这些键同样会出现在叶子节点中作为实际数据的一部分。叶子节点的键包含所有键值不重复每个键唯一对应一条数据除非允许重复键。4. 插入时的分裂规则当节点键数超过 m-1 时触发分裂将节点从中间位置第 ⌈m/2⌉ 个键切开。中间键被提升至父节点在内部节点中是副本不影响子树。分裂后左右节点各含约一半的键且都满足至少 ⌈m/2⌉-1 的约束。若父节点也溢出递归向上分裂最终可能产生新根节点树高度增加。5. 删除时的合并与借位规则当节点键数少于 ⌈m/2⌉ - 1 时触发调整先尝试借位从左或右兄弟节点借一个键过来通过父节点中转调整。否则合并将当前节点与一个兄弟节点合并并把父节点中对应的下界键下移。合并后父节点可能欠载递归处理。若根节点变为空树高度减一。6. 叶子节点链表规则所有叶子节点按键值顺序形成双向链表支持高效范围查询例如BETWEEN或 x。链表指针存储在叶子节点中不占用阶数 m 的计数它是额外元数据。对比 B 树的关键差异帮助你记忆特性B 树B 树数据存储位置仅叶子节点所有节点内部节点键仅是副本用于路由是真实键携带数据指针叶子节点链表有支持范围扫描无查询稳定性所有查找必须到叶子高度固定可能在非叶子命中一个实际例子m4即 2-3-4 树的变体非根节点至少 2 个孩子1-2 个键最多 4 个孩子3 个键。插入 10, 20, 30, 40前三个在一个叶子10,20,30插入 40 导致分裂中间键 20 上提到父节点左边叶子存 10右边叶子存 30,40。查询 35 时从根比较键 20 → 进入右子树 → 叶子节点内顺序查找。这些规则共同保证了树始终保持平衡所有叶子在同一层因此 B 树的高度约为 log⁡⌈m/2⌉Nlog⌈m/2⌉N在百万级数据下通常只需 3-4 次磁盘 I/O。第一部分索引生效的核心原理B树结构大多数关系型数据库MySQL、PostgreSQL 等默认使用B树存储索引。索引生效的数学本质是查询条件能够利用 B树叶子节点的有序链表进行快速定位和范围扫描。1.1 单列索引的有序性结构假设对age建索引B树叶子节点按age值从小到大排序并通过双向链表连接。生效逻辑等值查询WHERE age 20在树中二分查找定位到第一个20。范围查询WHERE age 20 AND age 30定位到20后顺着链表向右读取直到遇到30。1.2 联合索引的排序规则关键假设联合索引(A, B, C)。结构叶子节点内的数据首先按 A 排序A 相同时按 B 排序B 相同时按 C 排序。生效前提最左前缀法则查询条件必须包含A最左列的等值或范围条件。只有 A 定下来了B 才是有序的如果跳过 A 直接查 B那么在整个索引树中B 是全局乱序的无法利用链表扫描。text索引 (A, B, C) 的叶子节点示意 (1, 1, 1) - (1, 1, 2) - (1, 2, 1) - (1, 2, 3) - (2, 1, 1) - (2, 3, 1) ... ^ ^ ^ ^ ^ ^ A1区域内部B有序 A2区域内部B有序但全局B无序第二部分从原理推导失效原因索引失效的根本原因只有两类排序规则被破坏或索引代价过高被优化器放弃。2.1 破坏排序规则最左前缀场景跳过最左列SQLWHERE B 2索引为(A, B)原理推演在 B树中第一层排序键是AB只在A的内部有序。如果没给A数据库无法确定该从叶子链表的哪个位置开始找只能扫描全表。场景范围查询阻断后续列SQLWHERE A 1 AND B 2索引为(A, B)原理推演数据库通过A 1定位到一个起始点比如 A2 的位置。但在A2, A3, A4...这组数据中B是局部有序但全局不连续的例如 A2 里有 B1A3 里也有 B1。因此无法直接跳到“B2”的全局位置索引对B列失效只能用于 ICP 过滤。2.2 破坏值的可比性函数与类型转换场景对索引列使用函数SQLWHERE YEAR(create_time) 2024原理推演B树叶子节点存储的是原始值2024-01-01 00:00:00。查询条件是计算后的值2024。这相当于要比较f(x)和y而不是x和y。数据库无法直接利用排序好的原始值链表必须先计算出每一行的YEAR值再比较——这就是全表扫描。场景隐式类型转换SQLWHERE phone 13800138000phone是VARCHAR类型原理推演字符串和数字的比较规则在 MySQL 中会触发将字符串列转换为数值CAST(phone AS UNSIGNED)。这等于在列上套了一层函数原理同上排序规则瞬间无效。2.3 破坏前缀匹配模糊查询场景LIKE %abc原理推演B树是按字符串从左到右的字典序排列的。例如索引存储顺序a, ab, abc, b, bc。如果是LIKE abc%数据库可以快速定位到以abc开头的第一个词然后向右扫描。如果是LIKE %abc后缀abc可能在链表任何位置1abc在数字区zabc在字母区尾部无法定位起点只能全扫描。2.4 优化器的代价估算选择性低场景表中 80% 的行gender Male查询SELECT * FROM users WHERE gender Male原理推演即使有索引优化器计算发现走二级索引 - 回表查 80% 的数据行随机 IO 极多代价直接全表扫描顺序 IO。因此优化器主动放弃索引。这是逻辑失效而非物理结构失效。场景IS NOT NULL且大部分行非空原理推演B树索引不存储全为 NULL 的值稀疏索引特性。查非空意味着要查绝大部分数据优化器算账后觉得直接扫表更划算。第三部分总结对照表原理 - 现象失效现象根本原理违反最左前缀联合索引树按列顺序排序跳过头列导致后续列全局无序。范围查询后索引失效范围条件导致后续列仅在局部组内有序无法跨组索引定位。列上做运算/函数B树存的是原始值无法与计算后的结果直接进行有序比对。类型转换触发隐式函数作用于列等同于在列上做运算。LIKE %x字符串后缀匹配破坏了从左到右的字典序连续性。!或NOT IN查的是“除了某个点以外的全部”本质是范围过大优化器放弃。OR 包含无索引列优化器认为拆分成两次索引查询再合并去重代价可能高于一次全表扫描。通过这套推导逻辑我们就能理解索引不是“用了”就快而是“能用得上排序”才快。任何破坏数据在 B树中有序性的操作都会让索引失效。

基于相关熵的眼动注视点定位MATLAB工具包，含测试图集与核心函数源码

本文还有配套的精品资源，点击获取简介：这套MATLAB代码包实现了一种利用相关熵理论进行眼动注视点定位的完整流程，能从单张眼部图像中自动完成边缘提取、瞳孔区域识别和注视方向推算。核心函数包括get_coords.m（坐标提取&#…

2026/6/11 7:48:43 阅读更多

三合星链是什么：AI问答时代的品牌增长新范式与GEO系统化实践

1. 三合星链是一家什么公司？我们三合星链（全称：合肥市三合星链数字传媒科技有限公司）是一家聚焦AI问答场景品牌增长的AI应用服务公司。我们当前的核心业务是GEO生成式引擎优化托管交付，致力于帮助企业提升在AI答案中的…

2026/6/11 7:48:23 阅读更多

别再死磕特征值了！用Chebyshev多项式5行代码搞定PyTorch图卷积(GCN)

别再死磕特征值了！用Chebyshev多项式5行代码搞定PyTorch图卷积(GCN)当工程师第一次接触图卷积神经网络(GCN)时，往往会被复杂的数学推导吓退——拉普拉斯矩阵、特征值分解、傅里叶变换...这些概念让人望而生畏。但真实场景中，我们需要的不是完…

2026/6/11 7:48:23 阅读更多

头部汽金携手容联云，打造“千人千面”的呼入语音Agent

当一个汽车金融客户拨通400热线时，他往往只有一个目的：解决问题。但现实却是，大量客户在正式解决问题之前，要先经历漫长的“菜单迷宫”，层层菜单、重复验证、反复转接，最后客户无奈的转人工。痛点&#xff…

2026/6/11 9:10:03 阅读更多

JavaFX官方全功能示例包：含打砖块游戏、FXML登录界面、Swing混合嵌入与数据绑定实战代码

本文还有配套的精品资源，点击获取简介：直接运行就能看到效果的JavaFX经典案例集合，包含Oracle原版Ensemble演示程序，覆盖按钮、滑块、3D场景、折线图、视频播放、WebView等全部基础控件和高级特性；BrickBreaker是完…

2026/6/11 9:10:03 阅读更多

C++学习笔记系列2-5

本篇介绍“有参无返回值函数” 和 “无参有返回值函数”语法：返回类型函数名称参数列表void Func （int a）返回类型函数名称参数列表string Func （）通过语法形式&#x…

2026/6/11 9:09:02 阅读更多

PCL2启动器内存优化机制深度解析：从原理到实践

PCL2启动器内存优化机制深度解析：从原理到实践【免费下载链接】PCL Minecraft 启动器 Plain Craft Launcher（PCL）。项目地址: https://gitcode.com/gh_mirrors/pc/PCL 在Minecraft游戏社区中，内存管理一直是影响游戏性能…

2026/6/11 9:09:02 阅读更多

EPUBCheck终极指南：如何快速检测你的EPUB电子书质量

EPUBCheck终极指南：如何快速检测你的EPUB电子书质量【免费下载链接】epubcheck The conformance checker for EPUB publications 项目地址: https://gitcode.com/gh_mirrors/ep/epubcheck EPUBCheck是W3C官方维护的EPUB电子书一致性检查工具，作为…

2026/6/11 9:08:02 阅读更多

WorkshopDL完全指南：打破Steam创意工坊平台壁垒的终极解决方案

WorkshopDL完全指南：打破Steam创意工坊平台壁垒的终极解决方案【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 还在为Epic Games或GOG平台的游戏无法使用Steam创意工…

2026/6/11 9:08:02 阅读更多

LLM 多轮对话状态管理：从无状态 API 到有状态会话

LLM 多轮对话状态管理：从无状态 API 到有状态会话一、大模型 API 的无状态困境：上下文窗口的有限性与会话连续性大模型的 Chat API 本质上是无状态的——每次请求都需要发送完整的对话历史。这种设计简化了服务端实现，但给后端架构带来了两个…

2026/6/11 1:00:57 阅读更多

Spring Boot 3 与 GraalVM 原生镜像：从 JIT 到 AOT 的启动革命

Spring Boot 3 与 GraalVM 原生镜像：从 JIT 到 AOT 的启动革命一、JVM 冷启动的性能困境：云原生环境下的启动延迟 Java 应用在云原生环境中面临的核心挑战是冷启动延迟。一个典型的 Spring Boot 2 应用，启动时间约 3-8 秒，内存占…

2026/6/11 1:01:58 阅读更多

Go 错误处理与错误链：从哨兵错误到自定义错误类型的工程实践

Go 错误处理与错误链：从哨兵错误到自定义错误类型的工程实践一、Go 错误处理的工程困境：哨兵值与信息丢失 Go 的错误处理采用显式返回值模式，if err ! nil 是每个 Go 开发者最熟悉的代码片段。然而，当项目规模增长后，简…

2026/6/11 1:01:58 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/11 0:58:15 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/11 0:58:13 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/11 0:58:10 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/10 9:56:42 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/10 9:56:39 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/10 9:56:34 阅读更多

相关文章