Spring Cloud Gateway 限流：别把所有请求都当成一个用户

发布时间：2026/7/3 20:17:56

Spring Cloud Gateway 限流别把所有请求都当成一个用户网关限流看起来简单给接口设置 QPS超过就拒绝。但生产环境里限流维度如果设计不好很容易误伤。所有用户共用一个限流桶大客户被小客户影响只按 IP 限流NAT 后一群用户被当成一个人只按用户限流又挡不住某个接口被打爆。Spring Cloud Gateway 限流要按业务维度设计而不是只配一个全局阈值。一、限流维度要分层flowchart TD A[Request] -- B[Global Limit] B -- C[Tenant Limit] C -- D[User Limit] D -- E[Route Limit] E -- F[Backend Service]全局限流保护平台租户限流保证公平用户限流防滥用路由限流保护具体后端。不同层的目标不一样。分层限流还要注意层级间的相互作用。如果全局限流设置得太低会抵消掉租户级的配额如果租户限流太松单个大客户可能占满全局配额。一种做法是让请求依次通过各层限流任何一层拒绝就返回另一种做法是只在最细粒度限流上层只做监控和告警。前者保护更严格后者更灵活。选择哪种取决于你的业务模式和服务承诺。二、KeyResolver 要贴近业务身份Gateway 的限流通常需要KeyResolver。不要默认只用 IP最好根据租户、用户、接口组合生成 key。Bean public KeyResolver tenantUserKeyResolver() { return exchange - { String tenant exchange.getRequest().getHeaders().getFirst(X-Tenant-Id); String user exchange.getRequest().getHeaders().getFirst(X-User-Id); String path exchange.getRequest().getPath().value(); return Mono.just(tenant : user : path); }; }真实系统里租户和用户身份应该来自认证结果不要信任外部随便传的 header。如果请求来自微服务内部调用可能没有用户身份。这时可以考虑用服务名、实例 ID 或调用链 traceId 作为限流 key。内部调用通常信任度更高限流可以更宽松但也要防止某个服务 bug 导致疯狂调用下游。内部限流的目标不是限制正常流量而是快速发现异常。三、不同接口要有不同策略登录、查询、导出、AI 生成、支付回调限流策略不可能一样。高成本接口要更严格可缓存接口可以更宽松核心链路要配合降级。rate_limit_policy: /api/search: replenishRate: 50 burstCapacity: 100 /api/ai/generate: replenishRate: 5 burstCapacity: 10 /api/export: replenishRate: 1 burstCapacity: 2限流配置要能按环境和租户调整。企业客户、免费用户、内部系统调用通常不该混用一套阈值。四、限流响应要可观测限流不是简单返回 429。要记录 route、key、租户、剩余额度和拒绝原因方便排查误伤。{ event: rate_limited, route: /api/ai/generate, tenant: t_01, key_type: tenant_user_route, limit: 5, retry_after_ms: 12000 }客户端也需要明确的Retry-After否则用户只会看到失败不知道什么时候重试。限流时的用户体验也很重要。对于 Web 页面可以展示当前访问人数较多预计等待 X 秒对于 API 调用可以返回明确的错误码和建议重试时间对于移动端可以在客户端实现指数退避重试避免用户手动反复刷新。好的限流系统不只是拒绝请求而是在保护系统的同时尽量减少对用户的影响。在多网关实例的部署场景中基于内存的限流方案如 Resilience4j RateLimiter存在一个根本问题每个实例独立计数总限流额度单实例额度 × 实例数。假设配置全局 QPS 为 10004 个实例意味着实际 QPS 上限是 4000失去了限流的意义。解决方案是使用 Redis 作为分布式计数器通过 Lua 脚本保证令牌获取的原子性。但 Redis 方案也有代价——每个请求增加一次 Redis 调用约 1-2ms 延迟在高 QPS 场景下需要对 Redis 做分片或使用本地预取令牌优化。我们的折中方案是本地内存维护一个小的令牌缓冲Redis 每次下发 100 个令牌到本地实例在本地消耗令牌耗尽时异步向 Redis 申请下一批。这样 Redis 调用频率从每请求一次降为每 100 个请求一次延迟开销可以忽略不计同时误差控制在 10% 以内。五、总结Spring Cloud Gateway 限流要分层设计全局、租户、用户、路由分别保护不同目标。KeyResolver 要基于可信业务身份不同接口配置不同阈值限流事件必须可观测。限流不是为了拒绝用户而是为了让系统在压力下保持秩序。维度设计对了才不会把所有请求都当成一个用户。

STM32与WSEN-ISDS实现三轴运动追踪方案解析

1. 项目概述：三轴运动追踪的核心组件在工业自动化、无人机导航和虚拟现实等领域，精确追踪物体在三维空间中的运动状态一直是核心技术挑战。这个项目通过WSEN-ISDS六轴惯性测量单元(IMU)与STM32F415ZG微控制器的组合方案，实现了对物体角运动和…

2026/7/3 20:17:36 阅读更多

企业文件权限管理方案深度解析：从RBAC到32维权限体系

企业文件权限管理方案深度解析：从RBAC到32维权限体系引言：为什么权限管理是企业文件系统的核心在企业级文件管理场景中，权限管理是系统架构的核心组成部分。与个人云盘不同，企业环境下的文件访问涉及复杂的组织结构、多变的协作…

2026/7/3 20:17:15 阅读更多

基于PIC18F97J94与IN-PC55TBTRGB的智能灯光控制系统设计

1. 项目概述：用智能灯光打造沉浸式空间体验这个项目的核心思路是利用IN-PC55TBTRGB全彩LED灯带和PIC18F97J94微控制器，将普通空间转变为可编程的智能灯光环境。作为一名有十年嵌入式开发经验的工程师，我发现这种组合特别适合DIY爱好者和智能家…

2026/7/3 20:17:15 阅读更多

终极免费IDM激活完整指南：3步永久解锁下载神器

终极免费IDM激活完整指南：3步永久解锁下载神器【免费下载链接】IDM-Activation-Script IDM Activation & Trail Reset Script 项目地址: https://gitcode.com/gh_mirrors/id/IDM-Activation-Script 你正在寻找IDM永久激活的完美解决方案吗？I…

2026/7/3 21:29:03 阅读更多

微信聊天记录删了？3 种手机本地方法一键找回

周末整理手机相册时，想翻出上个月和闺蜜讨论旅行攻略的聊天记录截图，顺手点进对话框却发现——整段对话空白了。那些链接、地址、酒店推荐全都没了。明明没有主动删除，微信聊天记录怎么就不见了？其实，微信聊天记录删除…

2026/7/3 21:28:23 阅读更多

PingFangSC字体终极指南：6种字重+双格式支持，如何为你的Web应用节省50%字体加载时间

PingFangSC字体终极指南：6种字重双格式支持，如何为你的Web应用节省50%字体加载时间【免费下载链接】PingFangSC PingFangSC字体包文件、苹果平方字体文件，包含ttf和woff2格式项目地址: https://gitcode.com/gh_mirrors/pi/PingFangSC …

2026/7/3 21:25:59 阅读更多

5步掌握QtScrcpy：从零到精通的安卓投屏终极指南

5步掌握QtScrcpy：从零到精通的安卓投屏终极指南【免费下载链接】QtScrcpy Android实时投屏软件，此应用程序提供USB(或通过TCP/IP)连接的Android设备的显示和控制。它不需要任何root访问权限项目地址: https://gitcode.com/barry-ran/QtScrcpy 你…

2026/7/3 21:25:18 阅读更多

从零部署Hermes Agent：构建可自我进化的AI智能体助手

🚀 30款热门AI模型一站整合，DeepSeek/GLM/Claude 随心用，限时 5 折。 👉 点击领海量免费额度这次我们来看一个能自我进化的 AI 智能体项目——Hermes Agent。它由 Nous Research 开源，核心卖点是内置了一个“学习循…

2026/7/3 21:24:57 阅读更多

NonSteamLaunchers：Steam Deck玩家的终极多平台游戏整合解决方案

NonSteamLaunchers：Steam Deck玩家的终极多平台游戏整合解决方案【免费下载链接】NonSteamLaunchers-On-Steam-Deck Installs the latest UMU/GE-Proton and Non Steam Launchers under 1 Proton prefix folder and adds them to your steam library. Installs... …

2026/7/3 21:24:16 阅读更多

GPT-5与Veo3双引擎AI开发实战与避坑指南

1. 项目概述：下一代AI开发范式革新2026年的全栈开发正在经历一场静默革命。当GPT-5.2-Pro遇上Veo3，开发者终于可以摆脱繁琐的API对接噩梦。上周我用这个方案重构了公司的智能客服系统，原本需要3天完成的跨平台对接，现在只需在终端…

2026/7/3 0:00:48 阅读更多

AutoRaise终极指南：3分钟掌握macOS鼠标悬停自动激活窗口技巧

AutoRaise终极指南：3分钟掌握macOS鼠标悬停自动激活窗口技巧【免费下载链接】AutoRaise AutoRaise (and focus) a window when hovering over it with the mouse 项目地址: https://gitcode.com/gh_mirrors/au/AutoRaise AutoRaise是一款革命性的macOS窗口管…

2026/7/3 0:00:48 阅读更多

STM32G071RB与WSEN-ISDS IMU运动跟踪开发指南

1. 项目背景与硬件选型解析在嵌入式系统开发中，精确跟踪物体在三维空间中的运动和姿态是一个常见但极具挑战性的需求。WSEN-ISDS（型号2536030320001）是Wrth Elektronik推出的一款高性能6轴MEMS惯性测量单元(IMU)，结合STM32G071RB微…

2026/7/3 0:01:09 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/3 0:18:29 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/7/3 2:01:12 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/7/3 2:01:03 阅读更多

FAE放射组学分析工具：医学影像特征探索的完整解决方案

FAE放射组学分析工具：医学影像特征探索的完整解决方案【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手？想要从CT、MRI等影像中提取有价值的定量特征&#…

2026/7/3 0:03:16 阅读更多

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南【免费下载链接】happy-llm 📚 从零开始构建大模型项目地址: https://gitcode.com/GitHub_Trending/ha/happy-llm 还在为大型多模态模型动辄数十亿参数、显存占用高而烦恼&…

2026/7/3 0:18:23 阅读更多

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址…

2026/7/3 0:18:26 阅读更多

相关文章