KCC 的全局稳态带宽估计的同步：为什么我们不需要 CAS

发布时间：2026/6/8 16:35:29

KCC 的全局稳态带宽估计的同步为什么我们不需要 CAS1. 背景KCC 维护了一个全局 Kalman 滤波器用来估计共享瓶颈链路的稳态可用带宽kcc_kf_x带宽估计值BW_UNITkcc_kf_P估计协方差每一条 TCP 流在 PROBE_BW 的 cruise 阶段pacing_gain BBR_UNIT会将当前测得的带宽样本喂给这个滤波器。多个 CPU 上的不同流会并发调用kcc_kf_update()执行 read-modify-write 操作。2. 可能的质疑内核工程师审计时可能会指出“kcc_kf_update中先用atomic64_read读取 x 和 P计算新值后再atomic64_set写回。这不是一个原子 RMW 操作。两个 CPU 同时更新时后写回的那个会覆盖前一个的更新导致更新丢失。这是一个并发 bug。”3. 为什么这不是 bug因为全局带宽估计不需要每一次更新都被精确保留。原因有三3.1 估计对象是稳态值滤波器估计的是瓶颈链路的稳态可用带宽。这个值在秒级甚至分钟级尺度上才可能发生显著变化。而 ACK 间隔是毫秒级的。在两次有效变化之间滤波器会被更新几百上千次。丢失其中任意一次更新后续的样本会在几毫秒内把估计值拉回正确方向。最终收敛结果不变。3.2 “丢失”本身就是一种噪声采样多个 CPU 同时写入时后写覆盖先写等价于丢弃了一个样本。但如果这个样本是离群值瞬时噪声丢弃反而是有益的。如果这个样本是有效信号下一个 ACK同样来自 cruise 阶段几乎立刻会再送一个相似的样本进来。在稳态估计的场景下覆盖率 ≈ 采样率只要采样率远高于信号变化率丢失个别样本没有统计影响。3.3 加锁是过度工程如果换成 CAS 自旋锁或atomic64_cmpxchg高并发下1000 流会产生锁竞争增加软中断延迟代码复杂度上升引入新的优先级反转或死锁风险换来的是“微观精确但宏观无意义”的一致性我们选择不加锁不是因为我们不会写而是因为在这里不需要。4. 那为什么还要用 atomic64既然普通u64读写也够用64位平台对齐访问是原子的为什么代码里用的是atomic64_t三个原因按重要性排序4.1 内核规范与静态检查内核有 Data Race DetectorKCSAN和 Sparse 等工具。共享变量如果不标记为原子类型会被报告为潜在数据竞争。即使我们明确知道这个竞争无害也必须通过工具检查才能合入主线或通过 CI。用atomic64_t是最低成本的合规手段。4.2 保证编译器不优化普通u64可能被编译器缓存在寄存器中在多核环境下长期看不到其他 CPU 的更新。atomic64_read/set隐含了编译器屏障volatile语义强制每次读写都从内存或通过缓存一致性获取最新值。4.3 加速缓存同步atomic64_set会触发写屏障视架构而定促使当前 CPU 将更新尽快 flush 到缓存一致性域中让其他核心更快看到新值。对于稳态带宽估计快几百纳秒或几微秒没有实质收益。但几乎没有成本且符合“能快则快”的工程习惯。5. 结论这不是一个 bug。全局带宽估计容忍更新丢失这是设计意图。我们不需要 CAS 或自旋锁。它们解决了一个不存在的问题同时引入不必要的复杂性和开销。用atomic64_t是为了合规、可读和轻微的性能收益而不是为了原子 RMW。拥塞控制的核心是概率与统计不是数据库 ACID。接受不确定性接受“足够好”然后在物理法则的边界内做到最不坏——这就是 KCC 的态度。如果仍然有人坚持要在这里加锁我们只能说欢迎提交 patch但我们会 NACK。

2026年WeMod专业版免费解锁终极指南：三步实现完整功能体验

2026年WeMod专业版免费解锁终极指南：三步实现完整功能体验【免费下载链接】Wand-Enhancer Advanced UX and interoperability extension for Wand (WeMod) app 项目地址: https://gitcode.com/gh_mirrors/we/Wand-Enhancer 还在为WeMod专业版的高昂订阅费用…

2026/6/8 16:34:48 阅读更多

MGT5100 SDRAM/DDR内存控制器配置详解：从寄存器到实战

1. 项目概述：从硬件信号到软件配置的桥梁在嵌入式系统开发中，尤其是基于PowerPC这类高性能处理器的项目，内存子系统的设计与调优往往是决定系统稳定性和性能上限的关键。处理器核心再快，如果内存访问成为瓶颈，整个系统…

2026/6/8 16:34:48 阅读更多

IINA播放器完整指南：macOS上最强大的免费视频播放器解决方案

IINA播放器完整指南：macOS上最强大的免费视频播放器解决方案【免费下载链接】iina The modern video player for macOS. 项目地址: https://gitcode.com/gh_mirrors/iin/iina 还在为macOS上找不到完美的视频播放器而烦恼吗？每次遇到特殊格式的视…

2026/6/8 16:33:20 阅读更多

中国证书大全排行：2026年含金量高、值得考的职场通关秘籍

又到了一年一度职场人做规划、立Flag的时候。最近经常能听到身边的朋友或者年轻的职场新人抱怨：“现在的竞争太激烈了，想考个证傍身，但是网上一搜中国证书大全排行，跳出来成百上千个选项，眼睛都看花了，到底…

2026/6/8 22:27:30 阅读更多

IdentityCardOCR 源码深度解析：从工业级身份证识别到生产级架构设计

引言在商业银行的数字化转型浪潮中，身份证OCR识别已经成为身份认证、信息采集的核心基础设施。然而，真实业务场景中的身份证影像往往面临图像质量参差、水印文字重叠、分辨率差异大等严峻挑战。开源项目 IdentityCardOCR 正是为解决这些工业级痛点而生…

2026/6/8 22:27:30 阅读更多

基于RealSense与GRCNN的机械臂平面抓取Python实现，含标定、检测、后处理与硬件对接全流程

本文还有配套的精品资源，点击获取简介：直接可用的机械臂视觉抓取代码包，用Python实现GRCNN模型在平面场景中预测物体最佳抓取位姿。支持Intel RealSense系列RGB-D相机实时采集图像，内置相机标定脚本（run_calibrati…

2026/6/8 22:27:30 阅读更多

数据采集卡精度不够？别急着换硬件！一文讲透“两点标定”与ADC校准实战

zlinear开源电子前言大家好，我是ZLinear的硬件工程师。在之前的系列文章中，我们聊了选型、接地、隔离、指示灯……这些大多是硬件设计层面的硬核知识。但今天，我想聊一个纯软件层面的“魔法”——标定与校准。很多工程师在使用数据采…

2026/6/8 22:27:10 阅读更多

W55RP20-EVB-MKR 模块 MicroPython 实战 (11)：HTTP 协议与 OneNET 平台数据上云

2026/6/8 22:27:10 阅读更多

有偿求助，关于使用openWakeWord 0.6.0训练自己的唤醒词，有大牛能帮忙的可以联系我

我的环境是windows11python3.10 在使用openWakeWord0.6.0的过程中不断地出现各种错误使用豆包作为指导，但是它的指导信息滞后、版本与代码不匹配的情况，求大牛帮忙指导安装，测试到位，目前准备了1050条正样本，50000条负…

2026/6/8 22:26:49 阅读更多

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现【免费下载链接】amlogic-s9xxx-armbian Supports running Armbian on Amlogic, Allwinner, and Rockchip devices. Support a311d, s922x, s905x3, s905x2, s912, s905d, s905x, …

2026/6/8 0:00:25 阅读更多

Python Scrapy 爬虫实战进阶系列（一）：轻量化数据存储 - 数据精准写入 SQLite 数据库

前言在 Python 爬虫开发领域中，Scrapy 作为高性能、高可扩展性的异步爬虫框架，是行业内采集结构化数据的首选工具。在中小型爬虫项目、本地数据采集、轻量化数据存储场景中，SQLite 无需独立服务、单文件存储、原生兼容 Python 的特性&#…

2026/6/8 0:00:45 阅读更多

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案【免费下载链接】btrfs WinBtrfs - an open-source btrfs driver for Windows 项目地址: https://gitcode.com/gh_mirrors/bt/btrfs 还在为Windows无法访问Linux Btrfs分区而烦恼吗？你是…

2026/6/8 0:03:08 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/8 0:06:11 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/8 0:06:11 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/8 0:06:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/8 9:43:25 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/8 9:43:23 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/8 9:43:30 阅读更多

相关文章

2026年WeMod专业版免费解锁终极指南：三步实现完整功能体验

MGT5100 SDRAM/DDR内存控制器配置详解：从寄存器到实战

IINA播放器完整指南：macOS上最强大的免费视频播放器解决方案

中国证书大全排行：2026年含金量高、值得考的职场通关秘籍

IdentityCardOCR 源码深度解析：从工业级身份证识别到生产级架构设计

基于RealSense与GRCNN的机械臂平面抓取Python实现，含标定、检测、后处理与硬件对接全流程

数据采集卡精度不够？别急着换硬件！一文讲透“两点标定”与ADC校准实战

W55RP20-EVB-MKR 模块 MicroPython 实战 (11)：HTTP 协议与 OneNET 平台数据上云

有偿求助，关于使用openWakeWord 0.6.0训练自己的唤醒词，有大牛能帮忙的可以联系我

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现

Python Scrapy 爬虫实战进阶系列（一）：轻量化数据存储 - 数据精准写入 SQLite 数据库

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因