被Token坑惨后我悟了：LangGraph比LangChain省一半成本，原因就这两点

发布时间：2026/6/4 22:39:09

大家好我是杯子最近天天和 LLM 打交道的开发者。最近我被 OpenAI 的账单狠狠“教育”了一次一个月光 LangChain Agent 的 Token 费用就要到四位数了。我翻着日志一看——全是重复调用。每次用户问个简单问题Agent 都要先想、再查、再总结……LLM 被反复唤醒上下文越滚越大Token 像不要钱一样往外烧。直到我把 Agent 全部重构成了LangGraph后同样的业务Token 消耗直接腰斩。今天把核心的两个省 Token 逻辑讲透让大家少走我踩过的坑。一、LangChain Agent全自动浪费的“完美”流程用 LangChain 写带工具的 Agent 时框架帮你把一切都“自动化”了听起来很香但实际上是自动烧钱第一次 LLM 调用把用户问题系统 Prompt 工具描述塞进上下文让 LLM 决定「要不要用工具」。执行工具调用工具拿到结果。第二次 LLM 调用把工具返回结果再塞回上下文让 LLM 做最终总结并输出答案。关键问题来了这两次 LLM 调用是强制绑定的。即使工具返回的结果已经足够清晰比如查到了精确答案框架还是会再调用一次 LLM 去“润色”。我测过一个最简单的“查询天气” AgentLangChain 平均每次请求2 次 LLM 调用Token 消耗 ≈ 1200 tokens含上下文膨胀这还没算上多工具、多轮对话时上下文越滚越大的情况。LangChain 就像一台全自动洗衣机你只能选“标准模式”想省水省电门都没有。二、LangGraph你手动省油想省就省LangGraph 把 Agent 拆成一张状态图StateGraph每一步你自己决定怎么走。核心省钱逻辑就两点1. 工具调用后你可以直接跳过第二次 LLM 调用# LangGraph 伪代码超级简洁defroute_after_tool(state):iftool_result_is_enough(state[messages]):# 你自己判断returnEND# 直接结束不走第二次 LLMelse:returnllm# 需要 LLM 再总结才走graphStateGraph(AgentState)graph.add_node(tools,tool_node)graph.add_node(llm,llm_node)graph.add_conditional_edges(tools,route_after_tool)效果调用工具拿到结果后可以直接返回给用户不再进 LLM只有需要自然语言润色时才走第二次 LLM。很多场景下查询类、计算类、简单事实类工具返回结果就是最终答案。Token 直接少一半。我把 70% 的查询 Agent 都改成了这种“工具直出”模式Token 消耗从 1200 掉到 550 左右实测砍掉 50%左右。2. 通过 State 精准控制每次 LLM 的上下文LangChain Agent 的消息列表是全局共享、不断累积的越聊上下文越长。LangGraph 的 State 是你自己定义的你可以每次调用 LLM 前只把真正需要的消息塞进去历史总结、关键事实、当前工具结果把不重要的闲聊、旧工具结果直接丢掉或压缩甚至针对不同节点规划节点、工具节点、总结节点加载不同的 LLM 不同的上下文结果就是每一次 LLM 调用Prompt 都保持在最小必要长度。Token 不再偷偷膨胀。我最后想说LangChain 适合快速原型它把一切都自动化了但自动化自动浪费。LangGraph 把控制权交还给你它不帮你省你就继续烧你想省它就能帮你精准省到骨子里。我现在看到账单不再心慌反而有点小窃喜——因为我知道每一次调用我都亲自把过关没有一次多余的 Token。点赞收藏下次写复杂 Agent 的时候记得回来再看一遍省的钱够请我喝好几杯咖啡了 —— 链上杯子2026.3 写于被 Token 账单支配的恐惧中

【运维】CPU100%卡住了怎么办？快速找到出问题的程序

第一步：先确定是谁，找到PID 运行 top 看谁的CPU高： PID在第一列，这里是 20300 和 20237。这时可以获取 java可执行文件路径（在这里其实没啥用）： ls -l /proc/<PID>/exe 可以看到Java的…

2026/6/4 22:25:51 阅读更多

避坑指南：.NET MAUI页面跳转最常见的5个坑点及解决方案（2023最新版）

.NET MAUI页面导航避坑实战：5个高频问题与工业级解决方案刚接触.NET MAUI的开发者常会在页面跳转环节踩坑——传参莫名丢失、导航堆栈突然崩溃、模态窗口关闭失效...这些问题往往消耗大量调试时间。本文将结合GitHub高星issue和StackOverflow热帖，拆解5…

2026/6/4 17:03:26 阅读更多

Android Profiler实战：揪出那些偷偷耗电的‘电老虎’（附完整优化代码）

Android Profiler实战：揪出那些偷偷耗电的‘电老虎’（附完整优化代码） 作为一名Android开发者，你是否遇到过这样的场景：应用在后台运行时电量消耗异常，用户投诉"一晚上掉电30%"，但代码…

2026/6/4 7:08:16 阅读更多

TOPSIS怎么做：SPSSAU软件操作步骤与结果解读

一、TOPSIS所属模块TOPSIS在SPSSAU中属于【综合评价】模块。二、方法概述TOPSIS主要用于对多个评价对象进行综合排序，适合在多指标条件下比较各对象与最优方案、最差方案之间的接近程度。它常用于绩效评价、方案优选、区域比较和综合实力测评，尤其适合需…

2026/6/4 22:38:58 阅读更多

豆包回应收费传闻：日常功能免费，专业版服务一定额度内也免费！

豆包回应收费传闻，日常功能持续免费近日，针对“收费”传闻，豆包发布说明，明确表示广大用户日常使用的豆包功能，如搜索问答、写作生图、语音和视频对话等，将保持目前的免费服务。同时，否认了“降…

2026/6/4 22:37:57 阅读更多

微软Surface Laptop Ultra登场：搭载RTX Spark芯片，剑指高端MacBook Pro市场

Surface Laptop Ultra：搭载RTX Spark芯片的性能怪兽在今年台北电脑展上，微软低调展示了Surface Laptop Ultra。它搭载英伟达刚刚发布的RTX Spark超级芯片，这是一颗Arm架构的SoC，集成了20个CPU核心、拥有6144个Blackwell GPU核心的…

2026/6/4 22:37:57 阅读更多

实战指南：基于快马平台与codex，从零构建并部署一个可用的博客cms后端

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 我想开发一个实战性的个人博客内容管理系统（cms）后端。请使用快马平台的codex能力，生成一个基于node.js和express的完整后端项目代码。核心功能…

2026/6/4 22:37:37 阅读更多

如何在Windows任务栏打造你的专属股市监控中心：TrafficMonitor股票插件完全指南

如何在Windows任务栏打造你的专属股市监控中心：TrafficMonitor股票插件完全指南【免费下载链接】TrafficMonitorPlugins 用于TrafficMonitor的插件项目地址: https://gitcode.com/gh_mirrors/tr/TrafficMonitorPlugins 还在为繁琐的股市软件而烦恼吗&#…

2026/6/4 22:37:37 阅读更多

3步免费解锁VR视频：让3D全景内容在普通设备上自由播放

3步免费解锁VR视频：让3D全景内容在普通设备上自由播放【免费下载链接】VR-reversal VR-Reversal - Player for conversion of 3D video to 2D with optional saving of head tracking data and rendering out of 2D copies. 项目地址: https://gitcode.com/gh_mi…

2026/6/4 22:36:36 阅读更多

告别激活烦恼：IAR Embedded Workbench 许可证管理的最佳实践与合法替代方案探讨

IAR Embedded Workbench 许可证管理全指南与合规开发方案在嵌入式开发领域，IAR Embedded Workbench 以其高效的编译器和强大的调试功能著称，成为众多工程师的首选工具。然而，随着团队规模扩大和项目复杂度提升，许可证管理问题逐渐…

2026/6/4 0:03:11 阅读更多

赤铁矿磨矿过程运行优化控制软件系统【附程序】

✨ 长期致力于赤铁矿磨矿过程、磨矿粒度、数据驱动、运行优化控制、神经网络、案例推理、规则推理、软件系统研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1&…

2026/6/4 0:03:32 阅读更多

终极指南：如何使用Attu轻松管理你的Milvus向量数据库

终极指南：如何使用Attu轻松管理你的Milvus向量数据库【免费下载链接】attu The Best GUI for Milvus 项目地址: https://gitcode.com/gh_mirrors/at/attu Attu是一款专为Milvus向量数据库设计的现代化AI工作台管理工具，提供全面的可视化界面&…

2026/6/4 0:04:12 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/4 9:21:37 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/4 7:15:04 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/4 9:21:48 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/4 9:21:45 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/4 9:21:52 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/4 9:21:53 阅读更多

相关文章