Claude Code / Codex 到底把什么发给了模型？用 ccglass 做一次请求级观测

发布时间：2026/7/2 5:44:52

现在很多开发者已经开始把 AI 编程 Agent 当成日常工具使用。比如 Claude Code、Codex、OpenCode、Cursor、Cline、DeepSeek 相关 CLI、Kimi、Ollama、OpenRouter 等。它们不只是补全代码还会读项目、搜索文件、调用工具、运行命令、修改代码、解释错误甚至连续完成一个小型开发任务。这类工具确实提高了效率但也带来一个很现实的问题当 Agent 做错事时我们经常不知道它到底为什么错。你能看到它最终说了什么也能看到它改了哪些文件。但很多关键问题并不在最终回答里它到底把哪些上下文发给了模型system prompt 里有哪些限制和行为规则这一轮请求带了哪些 tool schema模型有没有真的返回 tool call工具结果有没有进入下一轮上下文input token 为什么突然变大cache 有没有命中请求慢到底是网络慢、模型慢还是上下文太重同一个任务下Claude Code 和 Codex 给模型的请求有什么差异如果这些问题看不到调试 AI Agent 就很容易变成猜测。这篇文章介绍一个开源工具ccglass。GitHub 地址https://github.com/jianshuo/ccglassccglass 是什么一句话概括ccglass 是一个面向 AI 编程 Agent 的本地观测工具用来查看 Agent 实际发送给大模型的请求和响应。它不是新的 AI 编程助手也不是模型服务商。它更像一个本地的请求观察层。当你运行 Claude Code、Codex、OpenCode、Kimi、Ollama、OpenRouter 等工具时ccglass 可以在本地启动一个代理服务把请求和响应记录下来再通过 Web Dashboard 展示出来。你可以在 Dashboard 中看到request / response bodysystem promptuser / assistant 消息历史tools schematool calltool resultstreamed chunkstoken 使用量cache 命中情况cost 估算latency 和吞吐不同请求之间的上下文 diff这对使用 AI 编程工具的人来说很有价值因为很多 Agent 的行为差异本质上都藏在请求层。为什么只看最终答案不够以前我们使用普通聊天模型时主要关注的是模型回答得对不对但 AI 编程 Agent 不一样。它不是一次性回答问题而是在多轮循环中不断做决策先读哪些文件是否要运行测试是否调用搜索工具工具参数怎么填工具返回结果后要不要继续请求模型哪些上下文需要保留是否应该修改文件所以 Agent 的失败不一定是“模型不聪明”也可能是请求链路里的某个环节出了问题。举几个常见例子。1. Agent 没有调用工具表面现象Agent 说自己无法确定结果或者直接给出一个泛泛的回答。可能原因tool schema 根本没有传给模型工具描述太模糊模型不知道何时使用system prompt 限制了工具调用客户端没有正确解析模型返回的 tool call。如果只看最终回答很难判断是哪种情况。用 ccglass 可以直接检查请求里有没有工具 schema响应里有没有 tool call。2. Agent 修改了错误文件表面现象它确实改了代码但改的不是问题所在。可能原因第一轮请求没有项目结构搜索工具返回了相似但无关的文件工具结果太长关键信息被稀释后续请求没有保留关键错误输出。这类问题看 Dashboard 里的消息历史和工具结果会更清楚。3. token 成本突然升高表面现象一个看似很小的任务跑了很多轮请求成本明显变高。可能原因每一轮都重复携带大量文件内容工具返回结果没有被压缩上下文没有有效裁剪cache 命中率低system prompt 和 tool schema 本身就很大。ccglass 可以展示 input token、output token、cache token 和 cost 估算。对于团队使用 AI 编程工具这些指标很有必要。ccglass 和普通抓包工具有什么不同有些同学可能会问这不就是抓包吗Charles、mitmproxy、Proxyman 不能做吗通用抓包工具当然有价值但 AI 编程 Agent 的场景有一些特殊点。很多 AI CLI 是 Node 或原生程序不一定稳定遵守HTTP_PROXY/HTTPS_PROXY。有些客户端还有自己的网络实现、认证逻辑或流式响应处理方式。直接 patchfetch也容易因为客户端升级而失效。ccglass 的思路是在本地启动一个代理服务。通过OPENAI_BASE_URL、ANTHROPIC_BASE_URL等环境变量把 Agent 请求指向本地代理。本地代理记录请求和响应。再把请求转发到真实模型 API。Dashboard 读取日志并可视化展示。这种方式的好处是不需要安装 CA 证书不需要解密 HTTPS不需要改客户端源码更适合观察 prompt、tool call、token、cache、cost、latency更贴近 AI Agent 的调试场景。它不是替代所有抓包工具而是把重点放在 AI 编程请求的可观测性上。快速开始ccglass 是一个 Node 工具安装方式很简单npm install -g ccglass安装完成后直接运行ccglass它会弹出交互式菜单让你选择要观察的客户端。也可以直接指定ccglass claude ccglass codex ccglass kimi ccglass opencode ccglass ollama ccglass openrouter例如观察 Codexccglass codex启动成功后终端会输出 Dashboard 地址类似dashboard: http://127.0.0.1:57633打开这个地址就可以实时查看请求记录。一个实际调试场景假设你让 Agent 修复一个测试失败项目里有一个测试失败请分析原因并修复。Agent 最后给出一个改动但测试仍然没过。这时如果只看最终输出你可能只能问它是不是没理解需求但用 ccglass可以把问题拆得更具体第一轮请求里是否包含测试失败信息Agent 是否真的运行了测试测试输出是否被完整返回给模型它搜索了哪些文件它读取的源码和测试是否匹配修改前最后一轮请求里模型到底看到了哪些上下文修改后是否又请求模型检查结果这样调试就从“猜 Agent 为什么错”变成“检查请求链路哪里断了”。适合哪些人使用我觉得 ccglass 特别适合下面几类开发者经常使用 Claude Code、Codex 等 AI 编程工具的人想研究不同 Agent 请求结构差异的人正在开发 AI Agent、IDE 插件或 OpenAI-compatible 客户端的人需要排查 tool calling 问题的团队关注 token 成本、cache 命中率和请求延迟的人想把 AI 编程过程沉淀成可复盘日志的人。如果你只是偶尔让 AI 写一段小代码可能暂时不需要它。但如果你已经开始让 AI Agent 参与真实项目尤其是让它读文件、改代码、跑测试、调用工具那么请求级可观测性会越来越重要。可以重点观察哪些指标第一次使用 ccglass 时可以先从这几个地方看1. system prompt看看 Agent 的底层规则是什么。很多行为差异不是模型本身造成的而是 system prompt 决定的。2. tool schema看看模型实际看到了哪些工具工具描述是否清晰参数结构是否复杂。3. tool call 顺序看看 Agent 是先读文件、先搜索、先跑测试还是直接修改代码。4. 上下文变化观察每一轮请求新增了什么、保留了什么、丢失了什么。5. token 和 cost关注 input token 是否持续膨胀cache 是否命中单次任务成本是否异常。6. latency区分是模型生成慢、上下文太大还是请求链路本身慢。总结AI 编程工具正在从“代码补全”走向“开发 Agent”。这个变化很重要因为 Agent 不只是生成代码它还会读上下文、调用工具、做决策、执行多轮任务。能力越强黑箱感也越强。如果我们只能看到最终回答就很难判断 Agent 是哪里做错了是 prompt 问题、工具问题、上下文问题、客户端解析问题还是 token 和成本控制问题。ccglass 的价值就在这里它把 AI 编程 Agent 的请求过程展示出来让调试从猜测回到证据。如果你也在用 Claude Code、Codex、OpenCode、Kimi、Ollama、OpenRouter 或其他 OpenAI-compatible 客户端可以试试这个工具。GitHubhttps://github.com/jianshuo/ccglass安装npm install -g ccglass启动ccglass对于越来越复杂的 AI 编程工作流来说看清请求层可能会成为开发者的基本功。

智慧租房管理系统

项目简介一个基于 Vue 3 Spring Boot 的在线租房管理平台，支持租户、房东、管理员三种角色，集成 DeepSeek AI 实现智能房源推荐。目录项目流程总览用户认证体系角色权限控制数据层设计统一响应与错误处理DeepSeek AI 智能推荐前后端通信前端架构技术…

2026/7/2 5:44:32 阅读更多

运维转大模型：自动化脚本到 AIOps A，从简历表达讲到项目复盘

聊《运维转大模型：自动化脚本到 AIOps A，从简历表达讲到项目复盘》之前，先说一句实在的：别急着背概念，先看它在真实项目里到底解决什么问题。摘要这篇面向想从运维、SRE 转向 AI 自动化平台的工程师，但不会…

2026/7/2 5:43:32 阅读更多

基于LP5812与PIC18F8722的RGB灯光控制系统设计

1. 项目背景与核心价值在智能硬件和交互设计领域，灯光效果已经成为提升用户体验的关键要素之一。从智能家居的氛围照明到消费电子产品的状态指示，再到游戏外设的动态光效，精心设计的灯光系统能够显著增强产品的情感化表达和功能直观性。这个项…

2026/7/2 5:43:11 阅读更多

固定资产全生命周期管理的RFID技术实践

一、问题背景企业固定资产管理长期面临"账实不符、盘点低效、状态不明"三大顽疾。传统模式下，资产从采购入库到报废处置的全过程依赖人工台账和条码标签，盘点一次动辄数周，且数据滞后严重。以某中型制造企业为例，其5000…

2026/7/2 7:13:47 阅读更多

2026国内零售业小程序开发公司TOP5综合排名（2026年7月更新）含零代码SAAS、AI编程、源码定制交付

一、汇总表工具更适合谁价格开发方式核心特点餐宝盈单店零售、预约到店、导购场景99元/年模板SAAS先预约、先留资、先导购BBWEYY覆盖5000行业包括零售、工厂、外贸、本地生活700元-15000元一年，买3送3年，年均降至350-7500元/年，每月还配有5-7…

2026/7/2 7:12:45 阅读更多

西安医院陪诊小程序开发公司排名，就诊预约系统技术拆解

西安三甲医院密集、就医人流量大，老年群体、异地就医人群、上班族就医刚需旺盛，医院陪诊小程序逐渐成为本地医疗便民服务的核心载体。区别于普通生活服务小程序，医院陪诊系统核心围绕就诊预约、时段锁定、陪诊师匹配、流程管控、就医状态同步…

2026/7/2 7:12:45 阅读更多

企业做GEO第一步为什么是知识库整理，而不是马上发文章

企业做GEO，不能只看概念是否新，也不能只看文章数量。更重要的是把用户问题、企业资料、内容发布和效果复盘连成一个闭环。知识库决定内容真实性知识库的作用，是把公司介绍、产品说明、服务边界、客户问题和证明材料统一起来。资料完整&…

2026/7/2 7:12:45 阅读更多

DPPS 磷脂避光储存适宜温度及有效存放周期探究

产品基础简介 DPPS 全称为二棕榈酰磷脂酰丝氨酸，属于阴离子功能性磷脂，常用来制备细胞凋亡靶向脂质膜结构，能够调控脂质微粒膜表面电荷，提升活性物质包裹效率。该磷脂碳链含有不饱和结构，对光照、高温、湿气与氧气均十…

2026/7/2 7:12:05 阅读更多

《墨香情》2026年7月最新官网下载：拳系定位、养成及实战技巧

在《墨香情》这款以 “武器定流派” 为核心特色的复古武侠 MMORPG 中，拳系以其独特的近战续航与爆发能力，成为了单挑和 BOSS 战中的佼佼者。本文将为你全面解析墨香情拳系的核心特点、养成攻略及实战技巧，助你在江湖中打出一片天地。《墨香情…

2026/7/2 7:11:45 阅读更多

Selenium元素定位全解析：从八大方法到实战策略

1. 项目概述：从“找东西”到“精准操控” 做自动化测试，尤其是Web UI自动化，最核心也最让人头疼的一步是什么？不是写复杂的业务逻辑，也不是处理异步加载，而是最基础的—— 让程序找到页面上那个你想操作的…

2026/7/2 0:00:12 阅读更多

移动端UI自动化测试框架Maestro终极指南：从入门到实战

1. 项目概述：为什么是Maestro？ 如果你正在寻找一个能让你快速上手、告别繁琐配置、并且对移动端UI自动化测试真正友好的框架，那么Maestro很可能就是你一直在等的那个答案。我接触过Appium、Espresso、XCUITest，也折腾过各种基于图…

2026/7/2 0:00:12 阅读更多

BurpSuite Cluster Bomb模式深度避坑指南：从原理到实战的完整爆破策略

1. 项目概述：从“能用”到“精通”的必经之路如果你正在学习或从事网络安全测试，尤其是Web应用安全评估，那么BurpSuite的Intruder模块绝对是你绕不开的核心工具。而Intruder模块里，功能最强大、也最让人又爱又恨的，莫过…

2026/7/2 0:00:33 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/2 0:09:58 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/7/2 1:54:44 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/7/2 1:54:44 阅读更多

FAE放射组学分析工具：医学影像特征探索的完整解决方案

FAE放射组学分析工具：医学影像特征探索的完整解决方案【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手？想要从CT、MRI等影像中提取有价值的定量特征&#…

2026/7/2 0:02:27 阅读更多

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南【免费下载链接】happy-llm 📚 从零开始构建大模型项目地址: https://gitcode.com/GitHub_Trending/ha/happy-llm 还在为大型多模态模型动辄数十亿参数、显存占用高而烦恼&…

2026/7/2 0:10:02 阅读更多

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址…

2026/7/2 0:09:58 阅读更多

相关文章

智慧租房管理系统

运维转大模型：自动化脚本到 AIOps A，从简历表达讲到项目复盘

基于LP5812与PIC18F8722的RGB灯光控制系统设计

固定资产全生命周期管理的RFID技术实践

2026国内零售业小程序开发公司TOP5综合排名（2026年7月更新）含零代码SAAS、AI编程、源码定制交付

西安医院陪诊小程序开发公司排名，就诊预约系统技术拆解

企业做GEO第一步为什么是知识库整理，而不是马上发文章

DPPS 磷脂避光储存适宜温度及有效存放周期探究

《墨香情》2026年7月最新官网下载：拳系定位、养成及实战技巧

Selenium元素定位全解析：从八大方法到实战策略

移动端UI自动化测试框架Maestro终极指南：从入门到实战

BurpSuite Cluster Bomb模式深度避坑指南：从原理到实战的完整爆破策略

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

FAE放射组学分析工具：医学影像特征探索的完整解决方案

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南