GitHub 狂揽 4万+ Star！这个项目直接让你省下 60–95% 的 Token

发布时间：2026/6/25 16:34:13

大家好我是Java1234_小锋老师。先说说Token 到底烧在哪了如果你经常用 Claude Code、Cursor、Codex 这类 AI 编程助手大概都有过这种体验搜一下代码返回 100 条结果一下子就是好几万 Token读日志、查 Issue、跑工具每一轮对话都在往上下文里堆东西模型不仅要「读」你发过去的内容还要「写」回复——两边都算钱问题往往不在你的问题本身而在工具输出、日志、RAG 检索结果、历史对话这些「背景噪音」。它们占了大头但真正有用的可能只有一小部分。Headroom 就是专门解决这个问题的。它在你的应用和 LLM 之间加了一层「压缩滤镜」把要发给模型的内容先瘦身模型该答对的还是答对Token 却能少掉60%95%。Headroom 是什么Headroom 是一个开源的AI Agent 上下文压缩层由 Tejas Chopra 发起目前在 GitHub 上已有4 万 Star。它压缩的对象包括工具调用返回的结果比如代码搜索、文件读取日志和报错信息RAG 检索到的文档片段文件内容和对话历史几个关键特点特点说明本地运行数据留在你的机器上不经过第三方 API可逆压缩原文会缓存在本地模型需要时可以再取回多种接入方式库、代理、MCP 服务器怎么方便怎么来跨 Agent 记忆Claude、Codex、Cursor 等可以共享压缩后的上下文它怎么工作的可以把 Headroom 想象成一条「预处理流水线」你的 Agent 本来要直接把一大坨内容扔给模型现在先经过 Headroom 筛一遍。否是你的 Agent / 应用Claude Code · Cursor · 自研程序原始上下文工具输出 · 日志 · RAG · 文件Headroom本地运行CacheAligner稳定前缀提高缓存命中ContentRouter识别内容类型SmartCrusher处理 JSONCodeCompressor处理代码 ASTKompress-base处理普通文本CCR 缓存原文压缩后的 Prompt 检索工具说明LLM 提供商Anthropic · OpenAI · Bedrock 等模型需要更多细节?直接回答大幅省 Token调用 headroom_retrieve从本地缓存取回原文简单说就是三步识别内容类型——JSON 走 JSON 的压缩器代码走 AST 分析普通文字走专用小模型智能压缩——去掉重复、冗余和低价值信息保留关键内容原文备份——压缩后的内容带着一个「哈希 ID」模型觉得不够用时可以按需取回另外还有一个CacheAligner很多云厂商会对相同前缀做 KV 缓存Headroom 会尽量让每次请求的前缀保持稳定让缓存真正命中进一步省钱。三种用法挑一种就行Headroom 不绑死某一种技术栈常见有三种接入方式1. 代理模式最省事headroom proxy--port8787把你的 AI 客户端指向本地 8787 端口不用改一行业务代码任何语言、任何框架都能用。2. 一行命令包装 Agentheadroom wrap claude# 或 codex / cursor / aider / copilot直接帮你启动代理并拉起对应的编程 AgentClaude Code、Cursor、Codex 等都支持。3. 库/SDK 嵌入Pythonfromheadroomimportcompress compressedcompress(messages,modelclaude-sonnet-4-20250514)TypeScriptimport{compress}fromheadroom-ai;constcompressedawaitcompress(messages,{model:gpt-4o});如果你用 LangChain、Agno、Vercel AI SDK、LiteLLM 等框架也都有对应的集成方式。MCP 客户端可以跑headroom mcp install获得headroom_compress、headroom_retrieve等工具。CCR压缩了还能找回来传统压缩有个两难压狠了怕丢信息压轻了省不了钱。Headroom 的CCRCompress-Cache-Retrieve机制把这个矛盾化解了大模型本地缓存Headroom工具/API大模型本地缓存Headroom工具/APIalt[压缩版够用][需要更多细节]返回大量数据如 1000 条搜索结果SmartCrusher 压缩为 Top 15 条原文按 hash 存入缓存发送压缩版检索说明直接完成任务调用 headroom_retrieve(hash)按 hash 取回原文约 1ms返回完整数据也就是说压缩是 aggressive 的但数据不是「删掉了」而是「暂存了」。模型觉得 15 条结果够用就省 90% Token觉得不够一个工具调用就能把原文拉回来。真实场景能省多少项目官方在真实 Agent 工作负载上做过测试数据比较有说服力场景压缩前压缩后节省比例代码搜索100 条结果17,7651,40892%SRE 故障排查65,6945,11892%GitHub Issue 分类54,17414,76173%代码库探索78,50241,25447%准确率方面在 GSM8K、TruthfulQA、SQuAD v2 等基准测试上压缩前后得分基本持平有些场景甚至略有提升——去掉噪音后模型反而更聚焦。另外Headroom 还能压缩模型写回来的内容输出 Token。开启HEADROOM_OUTPUT_SHAPER1后可以减少「好的让我来……」这类废话以及重复粘贴已有代码的习惯对 Opus 这类输出单价更高的模型尤其划算。适合谁用不适合谁比较适合每天用 AI 编程 AgentToken 账单看得心疼的人工具输出、RAG 检索结果经常很大的 Agent 应用开发者同时在 Claude、Codex、Cursor 之间切换想要共享上下文的人需要激进压缩、但又不能接受「压完找不回来」的场景可以跳过只用单一云厂商自带的对话压缩且不需要跨 Agent 能力运行环境完全沙箱化不能跑本地进程怎么开始安装Python 3.10pipinstallheadroom-ai[all]或者 Node 环境npminstallheadroom-ai快速体验三步走# 1. 安装见上# 2. 选一种模式headroom wrap claude# 包装编程 Agent# 或headroom proxy--port8787# 纯代理模式# 3. 查看节省效果headroom perf首次运行会下载约 500MB 的压缩模型Kompress-base之后会缓存在本地只下一次。写在最后AI Agent 时代上下文管理正在变成和模型选型一样重要的「基础设施」。Headroom 的思路很直接不是让模型变聪明而是别让模型读垃圾。4 万 Star 说明大家确实被 Token 账单折磨得不轻。如果你也在跑 Agent、搭 RAG、或者天天用 Cursor 写代码不妨花一分钟装个 Headroom 试试——本地跑、开源免费、压缩可逆试错成本很低。项目地址再次附上https://github.com/chopratejas/headroom

身份证遗失登报声明费用是多少？身份证遗失登报声明去哪办理？2026实测攻略

摘要：身份证遗失登报声明费用没有统一标准，2026年实测价格在80至400元区间，主要由报纸级别决定，全国性报纸便宜，市级报纸价格偏高。目前主流办理渠道分为线上平台和线下报社窗口，本文实测对比四大正规渠道&…

2026/6/25 16:34:13 阅读更多

用WBS任务拆解，彻底解决项目进度模糊、任务遗漏难题

很多项目推进中，普遍存在这些棘手问题：整体进度说不清、道不明，只能凭感觉判断；执行过程频繁出现任务空白，临近交付才发现漏做关键工作；团队分工模糊，工作重叠、推诿现象频发；项目临…

2026/6/25 16:34:12 阅读更多

墨香润夏：临汾夏令营里的文脉与成长

在众多注重素质教育的山西夏令营中，柿子山庄十二天成长营凭借浓厚的本土文化特色，走出了不一样的成长路径。营地课程内容丰富多元：平水雕版印刷非遗体验中，队员亲手制作专属拓片，近距离感受临汾本土非遗的魅力&#xf…

2026/6/25 16:34:12 阅读更多

孙正义股东大会透露多项布局：机器人量产、数据中心建设，称AI革命才刚开始！

6月24日，软银集团董事长孙正义在股东大会上透露多项重大计划，包括机器人量产、数据中心建设等，还表达了对AI发展的坚定信心，软银业绩也创新高。机器人业务新进展孙正义称已在某工厂开始机器人量产，即将正式发布。软银还…

2026/6/25 17:54:15 阅读更多

计算机Django毕设实战-基于 Django+Vue 的高校在线课程学习系统设计与实现基于 Django+Vue 的交互式网课学习平台【完整源码+LW+部署说明+演示视频，全bao一条龙等】

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…

2026/6/25 17:53:33 阅读更多

5分钟掌握跨平台资源下载：从视频号到抖音的无缝下载体验

5分钟掌握跨平台资源下载：从视频号到抖音的无缝下载体验【免费下载链接】res-downloader 视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载! 项目地址: https://gitcode.com/GitHub_Trending/re/res-downloader 你是否曾…

2026/6/25 17:53:12 阅读更多

终极Gmail批量生成神器：5分钟自动化创建无限邮箱账号的完整指南

终极Gmail批量生成神器：5分钟自动化创建无限邮箱账号的完整指南【免费下载链接】gmail-generator ✉️ Python script that generates a new Gmail account with random credentials 项目地址: https://gitcode.com/gh_mirrors/gm/gmail-generator 你是否厌…

2026/6/25 17:52:51 阅读更多

Mac窗口置顶神器Topit：让重要信息永远在最前方的高效解决方案

Mac窗口置顶神器Topit：让重要信息永远在最前方的高效解决方案【免费下载链接】Topit Pin any window to the top of your screen / 在Mac上将你的任何窗口强制置顶项目地址: https://gitcode.com/gh_mirrors/to/Topit 你是否经常在多个窗口之间来回切换&am…

2026/6/25 17:52:51 阅读更多

用友NC linkVoucher组件SQL注入漏洞(XVE-2024-12622)复现与深度解析

1. 项目概述与背景最近在安全圈里，用友NC的linkVoucher组件又爆出了一个SQL注入漏洞，编号是XVE-2024-12622。这个漏洞其实挺典型的，属于那种在参数拼接时没有做好过滤导致的，攻击者可以利用它来获取数据库里的敏感信息&#xff0…

2026/6/25 17:52:30 阅读更多

面试辅助工具横评：我试了5款AI面试工具，最后留下了OfferGo

上半年跳槽，面了十几家公司。说句实话，不是能力不行，是面试现场太容易崩了。明明准备了一周，面试官换个问法脑子就一片白。面完之后那个懊悔——其实我会的。后来开始试市面上的AI面试辅助工具。前前后后装了5款，踩…

2026/6/25 11:52:18 阅读更多

MC-037 | 自定义 Skill 开发：创建你的AI能力模块

MONKEYCODE 教程系列 MonkeyCode教程及推广系列 MC-037 自定义 Skill 开发：创建你的AI能力模块 >官网链接注册更放心哦https://monkeycode-ai.com/?ic019e0aed-c823-783c-b08a-4f030f891e4e 系列: 不爱土豆唯爱马铃薯 MonkeyCode 教程系列字数: 约 1400 字…

2026/6/25 11:52:18 阅读更多

PEER模型：多模型协作范式的工程化实践指南

1. 项目概述：这不是又一个大模型，而是一次协作范式的重构 “META’s PEER: A Collaborative Language Model”这个标题里藏着一个被多数人忽略的关键词—— Collaborative （协作）。它不是在说“模型更大了”“参数更多了”“训练…

2026/6/25 11:54:48 阅读更多

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/25 1:04:34 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗？diff-pdf这款开…

2026/6/25 1:04:45 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/25 1:04:41 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/25 12:27:19 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/25 12:27:19 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/25 12:27:19 阅读更多

相关文章

身份证遗失登报声明费用是多少？身份证遗失登报声明去哪办理？2026实测攻略

用WBS任务拆解，彻底解决项目进度模糊、任务遗漏难题

墨香润夏：临汾夏令营里的文脉与成长

孙正义股东大会透露多项布局：机器人量产、数据中心建设，称AI革命才刚开始！

计算机Django毕设实战-基于 Django+Vue 的高校在线课程学习系统设计与实现 基于 Django+Vue 的交互式网课学习平台【完整源码+LW+部署说明+演示视频，全bao一条龙等】

5分钟掌握跨平台资源下载：从视频号到抖音的无缝下载体验

终极Gmail批量生成神器：5分钟自动化创建无限邮箱账号的完整指南

Mac窗口置顶神器Topit：让重要信息永远在最前方的高效解决方案

用友NC linkVoucher组件SQL注入漏洞(XVE-2024-12622)复现与深度解析

面试辅助工具横评：我试了5款AI面试工具，最后留下了OfferGo

MC-037 | 自定义 Skill 开发：创建你的AI能力模块

PEER模型：多模型协作范式的工程化实践指南

Google AI Studio 300美元额度的真相与实战指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

计算机Django毕设实战-基于 Django+Vue 的高校在线课程学习系统设计与实现基于 Django+Vue 的交互式网课学习平台【完整源码+LW+部署说明+演示视频，全bao一条龙等】