平均 CPU 利用率指标为何该摒弃？多个案例揭示真相！

发布时间：2026/5/22 21:41:02

1. 作者信息与文章背景Jeremy Theocharis 是《平凡即卓越》作者、UMH 联合创始人兼首席技术官。文章基于其在 2026 年 4 月云原生亚琛聚会上的演讲探讨为何应摒弃平均 CPU 利用率指标。2. 应用程序问题引出我们应用程序中的一个 Go 函数在生产环境总是被取消执行。该函数设置严格超时时间同样代码在开发环境、CI/CD 管道及集成测试中正常运行但在生产环境有时超超时时间以 context deadline exceeded 错误终止。更糟的是使用的状态机库 1 在上下文被取消后无法自行恢复会崩溃并挂起且无法复现问题。与用户交流他们反馈 CPU 利用率正常我们花数周才找到问题根源。3. 为何平均 CPU 指标不够用从事计算机工作系统变慢时常打开任务管理器查看 CPU 情况。在 Linux 服务器可用 top、htop 等工具我们常关注平均 CPU 使用率。配置虚拟机时会选 vCPU 数量有“高性能”“专用”等昂贵选项但我们可能未探究原因。然而各种工具、供应商和仪表盘传达的直觉在这里失灵。所有工具只显示平均 CPU 利用率无法帮助解读该指标。CPU 利用率与可用容量非线性关系从 80% 到 81% 的 CPU 利用率提升增加的等待时间约是从 10% 到 11% 提升的 20 倍 2。即使 80% 利用率下有 20%“余量”延迟也已开始上升 3。平均 CPU 利用率适用于判断 CPU 是否有效利用是成本问题但仅适用于可等待的工作负载。对于对延迟敏感的工作负载更高利用率意味着更长等待时间。在我们案例中CPU 利用率不高遇到 Linux 内核 cgroup 特性及限流副作用。容器设置资源限制为 2000m内核视为时间预算预算耗尽容器会被限流直到下一个周期开始。我们和客户使用的工具未显示此问题所以花数周才找到 context deadline exceeded 错误原因。4. CFS 限流的实际工作原理假设在容器运行处理 HTTP 消息的服务按指南设置资源限制 4。kubectl top pod 显示使用 800 毫核水平 Pod 自动伸缩器HPA配置为 80% 利用率时扩容2000m 限制下使用 800m 仅 40%看似正常。但实际有三个关键数字决定情况资源限制 2000m、内核的 CFS 调度周期默认 100 毫秒 5、主机 CPU 4 核。容器可在节点所有 CPU 核心分配 200 毫秒时间。一个资源密集型 HTTP 请求可能 50 毫秒耗尽 4 核可用预算第二个请求会被限流需等 50 毫秒到下一个调度周期。若负载模式是“突发、空闲、空闲、空闲、突发”p99 延迟可能急剧上升但 CPU 图表仍显示正常。我们的 Go 函数就遇到此问题因其他 goroutine 耗尽周期可用预算函数因资源不足终止出现 context deadline exceeded 错误且底层库 1 上下文被取消时会陷入死锁CPU 图表却显示正常。Indeed Engineering 在 2019 年也发布类似案例 6。5. 如何发现并应对该问题我们花数周找错方向其实所需指标在 /sys/fs/cgroup/cpu.stat 中 7。内核为设置 CPU 限制的容器记录 nr_throttled 和 throttled_usec。运行 kubectl exec -- cat /sys/fs/cgroup/cpu.stat 可查看。若计数器增加说明有问题。在相关生态系统完善前需自己检查指标。Kube - prometheus 提供 CPUThrottlingHigh 警报但大多安装禁用因常误报 8。对于专用核心容器可通过 cat /sys/fs/cgroup/cpu.stat 检查同一目录的 cpu.pressure 可检测资源饱和 9。对于虚拟机 vCPU可通过 top 中 %st 查看“窃取时间”10。即时解决方法是检查这些指标长远需在应用程序层面进行资源饥饿检测。应用程序可检查一毫秒是否正常若不正常说明 CPU 资源不足可能是 CFS 限流、虚拟机窃取时间等原因。应用程序应发出警报并反应如推迟后台维护工作。Redpanda 的反应堆称此为“反应堆停滞”11CockroachDB 围绕 Go 的 /sched/latencies:seconds 直方图构建反馈控制器p99 延迟超 1 毫秒触发减少后台工作 12。Go 1.25 默认使 GOMAXPROCS 支持 cgroup13可降低资源饥饿风险但同一容器内其他进程耗尽共享预算时无能为力所以应用程序层面检测仍是通用解决方案。6. 总结为 Docker 容器设置资源限制是分配时间预算资源密集型 HTTP 请求可能瞬间耗尽节点核心资源平均 CPU 图表可能无法反映情况。应关注 cgroup 限流、内核 PSI、虚拟机管理程序窃取时间、应用程序层面资源饥饿信号等指标。综合使用这些指标可发现平均 CPU 图表隐藏的问题。在大型组织运行应用程序时因资源限制问题请求增加 CPU 或取消限制可能遭 IT 部门拒绝他们会提及审计和合规性指南。所以应摒弃平均 CPU 利用率指标而非取消资源限制可提供更多信息处理限制。若遇到类似讨论可分享此文章。

技术新人的“学习路径图”：别一上来就啃源码

在软件测试行业，我们经常看到一种现象：很多刚入行的新人，为了突破职业瓶颈，盲目模仿开发人员的成长路径，一头扎进自动化框架或底层工具的源码里，试图通过“硬啃”代码来寻求技术上的快速跃迁。然而&#xf…

2026/5/22 21:40:21 阅读更多

NotebookLM移动端PDF解析准确率暴跌？深度逆向其OCR pipeline后，我们找到了根本性兼容方案

更多请点击： https://kaifayun.com 第一章：NotebookLM移动端PDF解析准确率暴跌？深度逆向其OCR pipeline后，我们找到了根本性兼容方案近期大量用户反馈 NotebookLM iOS/Android 客户端在解析扫描型 PDF 时文字识别准确率骤降至不…

2026/5/22 21:39:40 阅读更多

Lovable主题定制深度教程：不改一行PHP代码，实现品牌专属UI/UX升级（仅限当前版本v4.8.3私有补丁包）

更多请点击： https://codechina.net 第一章：Lovable主题定制深度教程：不改一行PHP代码，实现品牌专属UI/UX升级（仅限当前版本v4.8.3私有补丁包） Lovable v4.8.3 通过其增强型 CSS 变量体系与声明式主题注入…

2026/5/22 21:38:39 阅读更多

Windows 11系统优化终极指南：Win11Debloat工具深度解析与实战应用

Windows 11系统优化终极指南：Win11Debloat工具深度解析与实战应用【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declu…

2026/5/22 22:33:33 阅读更多

PALM-2路径式推理架构：可审计、可干预、可落地的AI新范式

1. 项目概述：这不是又一个“大模型发布”，而是一次底层能力范式的迁移“AI Race Heating Up: Google Announces PALM-2”——这个标题里藏着的不是新闻通稿的惯常节奏，而是一条清晰的技术分水岭信号。我从2018年就在一线参与大模型推理优化&a…

2026/5/22 22:33:33 阅读更多

AI Agent落地10大避坑指南：从白皮书到生产环境的工程真相

1. 这不是技术文档翻译，而是一次“工程师对产品经理”的现场拆解你点开这篇标题，大概率是因为刚看到Google那篇《AI Agents: A Whitepaper on Principles, Capabilities, and Limitations》——PDF文件名长得像法律条文，开头三段全是“auton…

2026/5/22 22:32:11 阅读更多

AI Agent架构选型实战指南：从行为复杂度到协作粒度

1. 这不是理论课，是我在真实项目里踩坑后画出的AI Agent架构地图你有没有过这种感觉：刚学完LangChain，信心满满想搭个“智能客服”，结果写到第三层条件分支就发现逻辑像毛线团——用户问“查订单”，系统要先判断是否登…

2026/5/22 22:32:11 阅读更多

Python机器学习模型部署实战：从训练到生产环境

Python机器学习模型部署实战：从训练到生产环境引言作为从Python转向Rust的后端开发者，我深刻体会到机器学习模型部署的重要性。一个优秀的模型如果不能成功部署到生产环境，其价值将大打折扣。本文将从实战角度出发，详细介绍Pyth…

2026/5/22 22:32:11 阅读更多

AI去噪器：用深度学习建模噪声实现高保真数据清洗

1. 项目概述：当AI不再只是生成内容，而是成为数据清洗的“显微镜”和“手术刀”“Cleaning Data With AI Denoisers”——这个标题乍看像一句技术口号，但背后藏着数据科学领域正在发生的静默革命。我从2015年开始做工业传感器数据分析&#xf…

2026/5/22 22:31:30 阅读更多

单日大涨4.52%！华泰柏瑞中韩半导体ETF（513310.SH）上演“高热度”行情，溢价率风险引关注

5月21日，华泰柏瑞中韩半导体ETF（513310.SH）延续强势表现，当日收盘价报5.625元，涨幅达4.52%，盘中交投异常活跃，换手率109.80%，量比为1.32，市场资金交易热情高涨。然而&…

2026/5/22 0:00:46 阅读更多

11. 架构：前端工程化与状态管理实战

写在前面：如果说后端 MVT 引擎是 GIS 系统的“心脏”，那么前端就是它的“大脑”和“面孔”。在现代 WebGIS 开发中，如何优雅地管理复杂的图层状态、如何处理海量瓦片的渲染逻辑，是决定项目成败的关键。今天，我们将深入 light-mvt-server 的前端核心，看看如何利用 Vite …

2026/5/22 0:01:27 阅读更多

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟【免费下载链接】taojinbi 淘宝淘金币自动执行脚本，包含蚂蚁森林收取能量，芭芭农场全任务，解放你的双手项目地址: https://gitcode.com/gh_mi…

2026/5/22 0:02:07 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/22 17:05:13 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/22 16:54:23 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/21 2:29:29 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/22 14:41:35 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/22 11:03:47 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/22 3:58:33 阅读更多

相关文章

技术新人的“学习路径图”：别一上来就啃源码

NotebookLM移动端PDF解析准确率暴跌？深度逆向其OCR pipeline后，我们找到了根本性兼容方案

Lovable主题定制深度教程：不改一行PHP代码，实现品牌专属UI/UX升级（仅限当前版本v4.8.3私有补丁包）

Windows 11系统优化终极指南：Win11Debloat工具深度解析与实战应用

PALM-2路径式推理架构：可审计、可干预、可落地的AI新范式

AI Agent落地10大避坑指南：从白皮书到生产环境的工程真相

AI Agent架构选型实战指南：从行为复杂度到协作粒度

Python机器学习模型部署实战：从训练到生产环境

AI去噪器：用深度学习建模噪声实现高保真数据清洗

单日大涨4.52%！华泰柏瑞中韩半导体ETF（513310.SH）上演“高热度”行情，溢价率风险引关注

11. 架构：前端工程化与状态管理实战

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

py每日spider案例之某website之xin东方选课搜索接口(难度一般 扣取代码即可)

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)