Redis+MySQL双写踩坑记：我是如何优化千万级粉丝列表查询性能的

发布时间：2026/7/14 23:17:17

RedisMySQL双写踩坑记千万级粉丝列表查询性能优化实战记得去年接手社交平台核心模块重构时我遇到了职业生涯中最棘手的性能瓶颈——某顶流明星发布新动态后粉丝列表查询接口响应时间从200ms飙升到12秒。这个看似简单的谁关注了我功能在千万级数据量下暴露出了缓存与数据库协同设计的深层问题。1. 问题定位从慢查询到架构瓶颈那是一个周五晚上运维突然在群里我用户ID 8848的粉丝列表接口超时率突破90%打开监控面板看到的是触目惊心的曲线——这个拥有3700万粉丝的账号其分页查询在第5页之后响应时间呈指数级增长。1.1 原始架构的致命缺陷当时的系统设计非常教科书-- MySQL分页查询 SELECT follower_id FROM user_relations WHERE followee_id ? ORDER BY create_time DESC LIMIT 10 OFFSET 1000000配合最简单的Redis缓存策略def get_followers(user_id, page): cache_key ffollowers:{user_id} if not redis.exists(cache_key): db_results query_db(user_id) redis.zadd(cache_key, db_results) return redis.zrevrange(cache_key, page*10, (page1)*10-1)这套方案存在三个致命问题热点数据雪崩当大V粉丝突破千万级ZSET结构的内存占用超过6GB分页查询陷阱OFFSET 100万相当于MySQL要先扫描100万行双写一致性难题缓存更新延迟导致粉丝数显示不一致1.2 性能瓶颈的数学原理通过EXPLAIN分析发现当OFFSET超过10万时查询成本符合公式成本 (索引扫描成本) (数据行扫描成本) × OFFSET在我们的InnoDB配置下千万级分页查询的IOPS消耗达到惊人的(10ms索引扫描) (0.1ms/行 × 1,000,000) 100秒2. 分层缓存体系设计经过两周的压测和方案验证我们最终实现了响应时间稳定在50ms内的新架构。2.1 三级缓存解决方案缓存层级存储内容过期时间命中率本地缓存前5页粉丝ID1分钟92%Redis集群活跃粉丝区间数据1小时85%MySQL分区全量数据--关键实现代码def get_followers_v2(user_id, page): # 第一级本地缓存 if page 5 and local_cache.exists(user_id): return local_cache.get(user_id)[page] # 第二级Redis区间缓存 range_key frange:{user_id}:{page//100} if redis.exists(range_key): return redis.lrange(range_key, page%100*10, (page%1001)*10-1) # 第三级MySQL游标查询 return query_by_cursor(user_id, page) def query_by_cursor(user_id, page): last_id redis.get(fcursor:{user_id}:{page}) sql SELECT id, follower_id FROM user_relations WHERE followee_id ? AND id ? ORDER BY id DESC LIMIT 10 return execute_sql(sql, [user_id, last_id or MAX_INT])2.2 冷热数据分离策略对于粉丝数超过100万的热点用户我们采用动态分片策略最近3个月活跃粉丝存入Redis Sorted Set历史粉丝按季度归档到单独MySQL分区表使用BloomFilter快速判断粉丝是否存在// 热点用户判断逻辑 if (userService.isHotUser(userId)) { // 从热数据集群查询 return hotDataClient.queryFollowers(userId, page); } else { // 从常规集群查询 return normalDataClient.queryFollowers(userId, page); }3. 双写一致性的终极方案缓存与数据库的一致性问题我们最终采用异步校验最终一致的混合模式写操作流程graph TD A[用户关注动作] -- B[写MySQL binlog] B -- C[发MQ消息] C -- D[更新Redis计数器] D -- E[异步更新粉丝列表]一致性保障措施每小时全量校验Top 1000热点用户数据使用版本号解决ABA问题关键业务线启用强一致性读模式重要提示在粉丝数暴增场景下建议临时开启只读缓存模式牺牲部分一致性保证可用性4. 性能优化效果对比优化前后的关键指标对比指标优化前优化后提升幅度平均响应时间1200ms48ms25倍99分位耗时15s200ms75倍MySQL QPS3500120减少97%Redis内存占用68GB9GB节省87%特别在极端场景下如顶流明星官宣恋情系统表现峰值QPS从原来的1200提升到9500错误率从8.7%降至0.02%服务器成本减少40%5. 实战中的经验结晶在这次优化过程中有几个反直觉的发现值得分享ZSET不是万金油当成员超过500万时ZRANGE时间复杂度从O(log(N))退化为O(N)分页缓存的最佳区间经过测试每100页作为一个缓存区间最经济内存与命中率平衡点冷数据归档的魔法数字粉丝最后一次互动时间超过180天后读取概率下降至0.3%我们团队最后将这套方案抽象为通用组件在用户关系、商品收藏、消息列表等场景都得到了验证。特别是在一次电商大促中某爆款商品的收藏列表查询量达到每秒3万次依然保持了45ms的稳定响应。

Phi-3 Forest Laboratory 面试模拟实战：针对Java八股文的智能问答与解析

Phi-3 Forest Laboratory 面试模拟实战：针对Java八股文的智能问答与解析最近跟几个准备跳槽的朋友聊天，发现他们最头疼的就是技术面试。简历关过了，一到面试，面对那些经典的Java问题，比如“HashMap的底层原理是什么”…

2026/7/12 17:29:34 阅读更多

OpenClaw自动化办公：Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled-GGUF处理邮件与文档

OpenClaw自动化办公：Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled-GGUF处理邮件与文档 1. 为什么选择OpenClaw处理办公自动化去年夏天，我被堆积如山的邮件和会议记录压得喘不过气。每天花3小时处理邮件，2小时整理文档，工作…

2026/7/12 15:30:01 阅读更多

Qwen3-VL量化版实测：8bit精度仅降0.13%的奥秘

Qwen3-VL量化版实测：8bit精度仅降0.13%的奥秘【免费下载链接】Qwen3-VL-8B-Instruct-w8a8s-310 项目地址: https://ai.gitcode.com/Eco-Tech/Qwen3-VL-8B-Instruct-w8a8s-310 导语：阿里云Qwen3-VL视觉语言模型推出8bit量化版本Qwen3-VL-8B-Inst…

2026/7/13 5:55:00 阅读更多

2026年GEO服务商推荐：AI搜索优化哪家好？全场景选型对比指南

摘要：2026年GEO市场规模预计突破200亿元，AI搜索用户超6亿。本文按全案策略向、技术工具向、内容策略向、垂直区域向四大场景，横向对比联保致新、百分点科技、AIDSO爱搜、光引GEO等主流服务商的技术能力、价格区间与合规资质，为企业…

2026/7/14 23:17:00 阅读更多

HarmonyOS技术精讲-Camera Kit（相机服务）第2篇：开发环境与权限申请

HarmonyOS技术精讲-Camera Kit（相机服务）第2篇：开发环境与权限申请开篇：一个绕不开的坎很多人第一次接触Camera Kit时，最容易在权限配置环节出问题。官方文档虽然清楚列出了需要的权限声明，但实际开发中&a…

2026/7/14 23:16:19 阅读更多

HarmonyOS技术精讲-Camera Kit（相机服务）第4篇：拍照并保存照片

HarmonyOS技术精讲-Camera Kit（相机服务）第4篇：拍照并保存照片拍照是相机应用最核心的功能，没有之一。上一篇我们完成了预览，这次就是把“看”变成“拍”。为什么把拍照单独拿出来写？因为拍照本身不是难点…

2026/7/14 23:15:58 阅读更多

Linux内核调试利器：ftrace原理与应用详解

1. ftrace原理概述ftrace（Function Tracer）是Linux内核内置的一个轻量级追踪框架，它允许开发者在不重新编译内核的情况下动态追踪内核函数的执行情况。我第一次接触ftrace是在调试一个内核调度器问题时，当时就被它的低开销和灵活性…

2026/7/14 23:14:17 阅读更多

Pipelex：让业务逻辑回归AI工作流中心的确定性执行框架

1. 项目概述：当AI工作流不再只是“调API”，而是真正嵌入业务肌理Pipelex 这个名字乍听像某种管道接口协议，但实际它指向一个正在悄然改变AI工程实践的底层范式——把业务逻辑（Business Logic）重新放回AI工作流设计的中…

2026/7/14 23:13:36 阅读更多

新一代信息通信实践与应用

一、通信网络的发展1G-3G发展主要是面向人发展1G：手持终端（移动化推进）特点：电话发展时间：1983-1987年2G：数字终端能力（数字化推进）特点：彩信等发展时间：1991…

2026/7/14 23:13:36 阅读更多

元初混沌物理 108 篇第八十八篇星气落地物化定则

89. 星气落地物化定则一、核心总纲七星依托引力气运沿六合时空轨道向下传导，穿透天地时空结界，沉降至人域、地域地层，转化为地表五行气源，驱动山川、草木、流体、矿质持续演化，完整界定星气落地物化定则，打…

2026/7/14 0:01:25 阅读更多

北京华恒智信破解国企竞聘能上不能下成功案例

【客户行业】文旅行业【问题类型】人才培养【客户背景】随着国家住建部对产业分类标准的不断完善，特色小镇作为其中一类标准受到越来越多的关注。在文旅行业蓬勃发展的大背景下，国家提倡特色小镇向“强调文化IP”方向发展，倡导跨界融合&#…

2026/7/14 0:01:25 阅读更多

STM32与ICM-42605实现6DOF姿态解算实战

1. 项目背景与核心需求在智能硬件和物联网设备快速发展的今天，精确追踪物体在三维空间中的运动和方向成为了许多应用场景的基础需求。无论是无人机飞控、VR/AR设备姿态感知，还是工业自动化中的运动检测，都需要高精度的6自由度（6DO…

2026/7/14 0:02:06 阅读更多

MQ-2 烟雾传感器 ESP32-S3 驱动实战：ADC 读取与阈值校准 3 步完成

MQ-2 烟雾传感器 ESP32-S3 驱动实战：ADC 读取与阈值校准 3 步完成在智能家居和工业安全监测领域，烟雾检测是一个至关重要的环节。MQ-2 作为一款高性价比的半导体烟雾传感器，因其对多种可燃气体（如液化气、丙烷、氢气等&#xff09…

2026/7/14 11:40:08 阅读更多

SPEC CPU 2006 v1.0.1 基准测试实战：ARM/X86/MIPS 三平台配置与 3 轮测试结果解读

SPEC CPU 2006 跨平台基准测试深度实战：ARM/X86/MIPS 架构配置优化与结果分析方法论在当今多元化的计算架构时代，如何客观评估不同处理器平台的真实性能成为系统工程师和性能优化专家的核心挑战。SPEC CPU 2006 作为业界公认的计算密集型基准测试套件&am…

2026/7/14 6:47:01 阅读更多

每天60s读懂世界：2026年7月11日重点要闻解读

🔥 个人主页：杨利杰YJlio❄️ 个人专栏：《Windows 疑难杂症与工单复盘案例库》《Sysinternals实战教程》《WINDOWS教程》《Windows PowerShell 实战》《人工智能实战合集》《超简单：用Python让Excel飞起来》&#x1f31f…

2026/7/14 10:23:09 阅读更多

FAE放射组学分析工具：医学影像特征探索的完整解决方案

FAE放射组学分析工具：医学影像特征探索的完整解决方案【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手？想要从CT、MRI等影像中提取有价值的定量特征&#…

2026/7/14 21:11:47 阅读更多

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南【免费下载链接】happy-llm 📚 从零开始构建大模型项目地址: https://gitcode.com/GitHub_Trending/ha/happy-llm 还在为大型多模态模型动辄数十亿参数、显存占用高而烦恼&…

2026/7/14 19:53:54 阅读更多

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址…

2026/7/14 21:11:48 阅读更多

相关文章