第 36 篇 k8s之资源管理：Requests、Limits 与 QoS

发布时间：2026/6/4 1:56:58

IT策士 10余年一线大厂经验专注 IT 思维、架构、职场进阶。我会在各个平台持续发布最新文章助你少走弯路。在前面的文章中我们为 Redis 配置了持久化存储为 Flask 配置了健康检查和滚动更新。我们的应用越来越“生产化”了。但还有一个关键问题没有解决Pod 应该占用多少 CPU 和内存如果某个 Pod 突然内存泄漏会不会拖垮同一台节点上的其他 Pod在 Docker Compose 时代这个问题不那么突出——一台机器上跑的服务数量有限资源竞争不激烈。但在 K8s 集群中一台节点可能同时运行几十个 Pod资源的合理分配直接决定了集群的稳定性和调度效率。Kubernetes 提供了两个核心参数来管理容器资源Requests资源请求和Limits资源上限。它们共同决定了 Pod 会被调度到哪个节点、运行时的资源使用上限以及在资源紧张时 Pod 的“优先级”。今天我们就来彻底搞懂这套机制并把它应用到贯穿案例的 Flask Redis 应用中。一、Requests 和 Limits资源管理的两个维度1.1 基本概念Requests 和 Limits 分别回答了两个不同的问题Requests“调度时我需要至少多少资源” Scheduler 根据 Requests 为 Pod 选择节点——节点上所有 Pod 的 Requests 总和不能超过节点的总资源。这是调度的“准入线”。Limits“运行时我最多能用多少资源” 容器运行时的资源使用不能超过 Limits。CPU 超限会被限流变慢内存超限会被杀掉OOMKilled。这是运行的“天花板”。用一个日常类比来理解Requests 是你在餐厅预订的座位数量——餐厅只有在你预订的座位有空时才让你进。Limits 是你能点的菜的上限——你不能超过这个上限消费。你可以点菜实际使用少于预订座位数但不能超过菜的上限。1.2 可管理的资源类型K8s 主要管理两种资源CPU以“核”core为单位。1 CPU 1 个物理/虚拟核心。可以用小数表示如0.5半个核、250m250 millicpu 0.25 核。m后缀表示千分之一核——100m是 0.1 核。这是 CPU 最常用的计量单位。内存Memory以字节为单位。常见单位MiMebibyte2^20 字节、GiGibibyte2^30 字节。注意MMegabyte10^6 字节和Mi的区别——K8s 使用二进制单位Mi/Gi。1.3 CPU 和内存的超额行为这两种资源在超过 Limits 时的行为截然不同CPU 是可压缩资源容器超过 CPU Limits 时K8s 不会杀死容器而是限流throttle——让容器变慢等待下次调度。这就像高速公路的限速器你没法超过限速但车不会停。内存是不可压缩资源容器超过内存 Limits 时K8s 必须立即杀死容器OOMKillOut of Memory Kill。内存不像 CPU 可以“等一等再分配”——一旦进程申请了内存就必须立即满足。如果容器占用的内存超过了 Limitskubelet 会直接杀掉容器Pod 的RESTARTS计数加 1LAST STATE显示OOMKilled。二、三种 QoS 等级K8s 根据容器的 Requests 和 Limits 配置自动为 Pod 分配一个QoSQuality of Service服务质量等级。这个等级决定了在节点资源紧张时哪些 Pod 优先被驱逐Eviction。三种 QoS 等级的驱逐优先级背后是一个简单的原则为资源做出明确承诺Guaranteed的 Pod 享有最高的保护完全不做承诺BestEffort的 Pod 在资源紧张时最先被牺牲。如果你有一个 BestEffort 等级的批处理任务和一个 Guaranteed 等级的核心业务 Pod当节点内存不足时kubelet 会优先驱逐批处理任务。三、动手配置并验证3.1 为贯穿案例配置资源限制将 Requests 和 Limits 应用到 Flask 应用的生产级 Deployment 中apiVersion: apps/v1 kind: Deployment metadata: name: flask-deployment spec: replicas:3selector: matchLabels: app: flask-counter template: spec: containers: - name: flask image: flask-redis-counter:3.0 resources: requests: cpu:100mmemory:128Milimits: cpu:500mmemory:256Mi配置解读Requests 为每个 Flask Pod 请求 100m CPU 和 128Mi 内存Scheduler 确保节点上有足够资源才调度。Limits 限制每个 Pod 最多使用 500m CPU 和 256Mi 内存。这个 Pod 的 QoS 等级是 BurstableRequests ≠ Limits。部署后验证资源配置kubectl apply-fflask-deployment-resources.yaml kubectl get pods-lappflask-counter# NAME READY STATUS RESTARTS AGE# flask-deployment-xxxxxxxxx-xxxxx 1/1 Running 0 30s查看 QoS 等级kubectl get podpod-name-ojsonpath{.status.qosClass}# Burstable3.2 对比三种 QoS 等级的行为BestEffort最不稳定containers: - name: besteffort-demo image: alpine command:[stress,--vm,1,--vm-bytes,200M]# 不设置 resources → QoS BestEffortBurstable中等containers: - name: burstable-demo image: alpine command:[stress,--vm,1,--vm-bytes,200M]resources: requests: memory:64Milimits: memory:128Mi# Requests Limits → QoS BurstableGuaranteed最稳定containers: - name: guaranteed-demo image: alpine command:[stress,--vm,1,--vm-bytes,200M]resources: requests: memory:128Micpu:100mlimits: memory:128Micpu:100m# Requests Limits → QoS Guaranteed当节点内存不足时kubelet 会按 BestEffort → Burstable → Guaranteed 的顺序驱逐 Pod。对于生产环境的核心服务建议设置 Requests Limits 来获得 Guaranteed 等级。但注意这也会导致资源预留更多——即使容器实际只用 50Mi 内存K8s 也会为它预留完整的 128Mi。3.3 如何合理设定 Requests 和 LimitsRequests 的设定依据——监控数据Requests 应该基于应用在正常运行时的实际资源消耗来设定而不是凭感觉。你可以通过kubectl top pod观察应用在稳定状态下的 CPU 和内存使用将其作为 Requests 的基准值。例如Flask 应用在无负载时使用约 30Mi 内存那么 Requests 设为 64Mi 是合理的既能保证调度正确又不会预留过多空闲资源。Limits 的设定依据——压测数据Limits 应该基于应用的峰值资源需求来设定。通过压测工具模拟高并发流量观察 CPU 和内存的峰值再留出一定的余量。对于内存余量建议在 20%-30% 左右以应对突发流量。对于 CPULimits 可以设为 Requests 的 3-5 倍利用 CPU 的可压缩特性让应用在流量高峰时能“借用”空闲 CPU 资源平时则释放给其他 Pod。避免过度限制Requests 设置得过高会浪费集群资源节点上实际空闲的资源被预留无法调度新 Pod。Limits 设置得过低会导致 OOMKill内存或性能严重下降CPU 被过度限流。如果你不确定可以用kubectl top pod观察一段时间后再做调整而不是一开始就设置非常严格的 Limits。四、LimitRange 与 ResourceQuota单个容器的 Requests/Limits 解决了 Pod 级别的资源约束。但在多团队共享集群时还需要命名空间级别的资源管控。4.1 LimitRangeLimitRange 为命名空间中的 Pod 和容器设置默认的 Requests/Limits防止团队创建没有任何资源约束的 PodapiVersion: v1 kind: LimitRange metadata: name: default-limits spec: limits: - type: Container default: cpu:500mmemory:256MidefaultRequest: cpu:100mmemory:128Mimax: cpu:2memory:1Gimin: cpu:50mmemory:64Mi这样设置后该命名空间中新创建的容器如果不指定resources会自动使用defaultRequest和default。同时任何容器都不能超过max或低于min。4.2 ResourceQuotaResourceQuota 限制整个命名空间的资源使用总量防止某个团队过度消耗集群资源apiVersion: v1 kind: ResourceQuota metadata: name: team-quota spec: hard: requests.cpu:10requests.memory:20Gilimits.cpu:20limits.memory:40Gipersistentvolumeclaims:10当命名空间中的资源使用超过 Quota 时新的 Pod 创建请求会被拒绝。LimitRange 和 ResourceQuota 通常一起使用形成命名空间级别的资源管控体系。五、ResourceQuota 与 QoS 的协同ResourceQuota 和 QoS 等级在资源紧张时形成互补的决策链路。当节点内存不足时kubelet 首先按照 QoS 等级排出 Pod 的驱逐优先级BestEffort → Burstable → Guaranteed但在同一 QoS 等级内部会优先驱逐那些超出 Requests 更多的 Pod。这意味着什么如果你有两个 Burstable 等级的 Pod一个内存 Requests 为 128Mi实际使用了 500Mi超出 372Mi另一个 Requests 为 256Mi实际使用了 300Mi超出 44Mikubelet 会优先驱逐前者——它在同一 QoS 等级中“超量”使用更多。这也是为什么将 Requests 设定为真实平均使用量如此重要它不仅仅是调度凭证更是资源紧张时的保护机制。六、与 Docker Compose 的对比在 Docker Compose 中资源限制是可选的且相对简单deploy: resources: limits: cpus:0.50memory: 256M但在 K8s 中Requests 和 Limits 是两个独立的维度它们的交互产生了 QoS 等级、驱逐优先级、调度策略等复杂的机制。Compose 没有“资源请求”的概念所以调度选择哪台宿主机完全是手动的。K8s 的 Scheduler 则依据 Requests 自动做出最优决策大大降低了大规模集群中资源分配的运维成本。七、命令速查表八、本篇总结Requests调度依据声明 Pod 需要的最小资源。Scheduler 确保节点资源足够Requests 总和不能超过节点总资源。Limits运行上限限制 Pod 能使用的最大资源。CPU 超限被限流内存超限被 OOMKill。QoS 等级由 Requests 和 Limits 的配置关系自动决定分为 Guaranteed、Burstable、BestEffort 三个等级决定了资源紧张时 Pod 被驱逐的优先级。配置原则Requests 基于监控数据设定为平均使用量Limits 基于压测数据设定为峰值余量。生产核心服务建议设置为 GuaranteedRequests Limits。LimitRange 和 ResourceQuota从命名空间层面确保资源使用的规范和公平是多团队共享集群的必备管控手段。通过本篇你的 Pod 不会再“无限制地吃资源”集群的稳定性和可预测性得到了质的提升。下一篇——第 37 篇调度进阶亲和性、污点与容忍我们将学习如何精细控制 Pod 应该被调度到哪些节点上实现更高级的调度策略。想了解更多还可以去各个平台搜索「IT策士」一起升级 IT 思维

nRF52832全双工对讲固件：集成WM8979音频驱动、ADPCM压缩与功率放大支持

本文还有配套的精品资源，点击获取简介：一套面向nRF52832芯片的即用型全双工无线对讲固件方案，基于Enhanced ShockBurst（ESB）协议实现低延迟音频传输，无需蓝牙协议栈即可完成点对点语音通信。硬件适配WM…

2026/6/4 1:54:57 阅读更多

别再分开求实部虚部了！Wirtinger导数入门：以复数模平方|z|²求导为例

复数求导新范式：Wirtinger导数在模平方函数中的实战解析在信号处理与机器学习领域，复数运算早已不是理论数学家的专属玩具。当我们试图对复变函数进行优化时，传统求导方法往往会遇到令人头疼的障碍——特别是当函数输出为实数时。想象一下&am…

2026/6/4 1:54:57 阅读更多

GENESIS框架：基于遗传算法与神经网络的SFC嵌入优化

1. 项目概述服务功能链（Service Function Chaining, SFC）嵌入是网络功能虚拟化（NFV）领域的核心挑战之一。简单来说，它就像是在数据中心网络中规划一条"快递路线"——需要将一系列虚拟网络功能（VN…

2026/6/4 1:54:16 阅读更多

企业级AI通知系统构建全链路（从OpenAI API到钉钉/企微实时触达）

更多请点击： https://kaifayun.com 第一章：企业级AI通知系统构建全链路（从OpenAI API到钉钉/企微实时触达） 企业级AI通知系统需打通大模型推理、事件决策、多通道分发与状态回溯四大能力层，形成低延迟、高可靠、可审计…

2026/6/4 2:47:43 阅读更多

Python图像轮廓提取实战包：Jupyter笔记+测试图+可调脚本

本文还有配套的精品资源，点击获取简介：直接运行就能看到效果的图像轮廓提取工具集，用OpenCV实现传统图像处理流程：从读取图片开始，依次完成灰度化、高斯模糊降噪、Canny边缘检测、findContours查找轮廓&#xff0c…

2026/6/4 2:47:22 阅读更多

Abaqus工程师常用四工具包：cohesive单元自动插入、裂缝路径提取、混凝土骨料建模与CDP参数快速配置

本文还有配套的精品资源，点击获取简介：面向Abaqus用户的一站式插件工具集，开箱即用，不依赖额外环境或注册。POLARIS_InsertCohElement支持在任意装配面批量插入cohesive单元，适配接触面预处理；ABQ_Crac…

2026/6/4 2:47:22 阅读更多

用ESP8266 DIY一个智能家居控制中枢：手把手教你配置AP模式，让手机直连控制设备

用ESP8266打造零配置智能家居控制中枢：AP模式深度实战指南在智能家居DIY领域，ESP8266凭借其出色的性价比和丰富的功能库，已经成为创客们的首选芯片。而其中AP模式（Access Point）的应用，更是为家庭自动化提供…

2026/6/4 2:47:02 阅读更多

别再手动传证书了！用Kubernetes的certificates.k8s.io API自动管理TLS证书（附Java应用接入实战）

Kubernetes原生TLS证书自动化管理：从API到Java应用的无缝集成在云原生架构中，TLS证书管理一直是DevOps团队面临的痛点之一。传统的手动签发、分发和更新证书的方式不仅效率低下，还容易因人为疏忽导致服务中断。Kubernetes提供的 certificat…

2026/6/4 2:46:01 阅读更多

向上沟通的致命误区：基层谈战略，高层抠细节

在职场中，你是否发现过这样一种现象： 大领导（高职级）讲话，往往云山雾罩，喜欢谈趋势、谈战略、谈”我们要去哪里” 中层或基层（低职级）汇报，往往事无巨细，喜…

2026/6/4 2:46:01 阅读更多

告别激活烦恼：IAR Embedded Workbench 许可证管理的最佳实践与合法替代方案探讨

IAR Embedded Workbench 许可证管理全指南与合规开发方案在嵌入式开发领域，IAR Embedded Workbench 以其高效的编译器和强大的调试功能著称，成为众多工程师的首选工具。然而，随着团队规模扩大和项目复杂度提升，许可证管理问题逐渐…

2026/6/4 0:03:11 阅读更多

赤铁矿磨矿过程运行优化控制软件系统【附程序】

✨ 长期致力于赤铁矿磨矿过程、磨矿粒度、数据驱动、运行优化控制、神经网络、案例推理、规则推理、软件系统研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1&…

2026/6/4 0:03:32 阅读更多

终极指南：如何使用Attu轻松管理你的Milvus向量数据库

终极指南：如何使用Attu轻松管理你的Milvus向量数据库【免费下载链接】attu The Best GUI for Milvus 项目地址: https://gitcode.com/gh_mirrors/at/attu Attu是一款专为Milvus向量数据库设计的现代化AI工作台管理工具，提供全面的可视化界面&…

2026/6/4 0:04:12 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/3 4:17:19 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/3 4:17:20 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/3 4:17:20 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/3 5:40:28 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/3 4:17:20 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/3 4:17:19 阅读更多

相关文章

nRF52832全双工对讲固件：集成WM8979音频驱动、ADPCM压缩与功率放大支持

别再分开求实部虚部了！Wirtinger导数入门：以复数模平方|z|²求导为例

GENESIS框架：基于遗传算法与神经网络的SFC嵌入优化

企业级AI通知系统构建全链路（从OpenAI API到钉钉/企微实时触达）

Python图像轮廓提取实战包：Jupyter笔记+测试图+可调脚本

Abaqus工程师常用四工具包：cohesive单元自动插入、裂缝路径提取、混凝土骨料建模与CDP参数快速配置

用ESP8266 DIY一个智能家居控制中枢：手把手教你配置AP模式，让手机直连控制设备

别再手动传证书了！用Kubernetes的certificates.k8s.io API自动管理TLS证书（附Java应用接入实战）

向上沟通的致命误区：基层谈战略，高层抠细节

告别激活烦恼：IAR Embedded Workbench 许可证管理的最佳实践与合法替代方案探讨

赤铁矿磨矿过程运行优化控制软件系统【附程序】

终极指南：如何使用Attu轻松管理你的Milvus向量数据库

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因