利用异步编程的 future 思想，让 LLM Agent 快 1.44 倍

发布时间：2026/5/19 8:59:32

一句话总结Agent 系统中 function calling 存在同步阻塞AsyncFC 借鉴异步编程中的 future/promise 机制在执行层实现解码与函数执行的重叠以及函数间并行在不修改模型、不打破 FC 协议的情况下显著降低延迟论文标题Concurrency without Model Changes: Future-based Asynchronous Function Calling for LLMs论文地址https://arxiv.org/abs/2605.15077作者背景加州大学伯克利分校一、动机现代 LLM Agent 的核心能力之一是 function calling工具调用。标准协议很简单模型生成一个结构化的函数调用 → Runtime 框架执行 → 结果追加到对话历史 → 模型继续解码。问题在于这个过程是严格同步的模型发出函数调用后解码完全阻塞直到函数执行完毕返回结果想象一下你让 Agent 帮你订机票、查天气、发邮件三件事。同步模式下模型必须等订票 API 返回可能要好几秒才能开始想下一步。即使查天气和发邮件跟订票结果完全无关也得排队等着。这就像一个程序员写了三行独立的 API 调用却非要用 await 串行执行之前的解决方案主要有两类1. 展示中间结果在函数执行期间不阻塞模型而是把 “函数正在执行中” 或 “部分结果” 这类中间状态直接暴露给模型让模型在看到这些不完整信息的情况下继续生成这实际上破坏了 function calling 协议模型需要理解适应新的交互模式可能造成效果变差2. 规划任务依赖让模型自己拆解任务理清每一步的依赖关系最终生成可以部分并行的函数调用。这对模型能力的要求较高可能需要额外训练对此作者提出了 AsyncFC 方法目标是让系统 Runtime 做并发管理而模型完全无需知道自己在异步执行二、实现方案2.1 Future 即刻返回AsyncFC 的核心灵感来自异步编程中的 future/promise 模式。当模型发出一个函数调用时Runtime 框架不再阻塞等待执行完成而是立即返回一个 future placeholder符号占位符。模型拿到这个占位符后可以继续解码后续的函数调用 —— 就像写异步代码时拿到一个 Promise 对象后可以继续写下一行一样具体来说AsyncFC 做了三件事1. Schema 变换把同步函数的 schema 自动改写为支持 future 输入输出的版本。具体地允许工具函数的返回值是 “future ID”输入参数也可以接受具体值或 future ID这样模型就能把一个函数的 future 结果直接传给下一个函数作为参数2. await_future 函数当模型确实需要某个函数的具体结果才能继续推理时可以调用await_future来显式等待。Runtime 框架检测到这个调用后会提前终止解码开始轮询已完成的结果3. 结果注入已完成的函数结果会在 turn boundary模型停止解码的时刻被主动注入到上下文中不需要模型显式 await2.2 依赖感知调度异步执行带来了一个新问题如果两个函数调用之间有依赖关系盲目并行会导致错误。AsyncFC 的调度器默认保守地按解码顺序串行执行所有函数开发者可以通过一个装饰器标注函数的资源访问模式读/写哪些路径调度器据此推导依赖关系只在安全时才并行执行调度流程分三个阶段准入屏障函数调用入队后按队列顺序逐个准入。如果函数的资源路径依赖于尚未解析的 future 值则等待冲突分析State Tree 记录每个函数的读写区域。新函数到来时检查是否与已注册的访问标签有重叠。有重叠则建立阻塞依赖执行派发无阻塞依赖的函数被派发到独立 worker 执行。执行完成后释放 future 和访问标签解除下游函数的阻塞这个设计类似于 CPU 中的 scoreboarding 调度和 Legion 的 region-based 依赖分析 —— 用硬件/系统级的方法解决并发安全问题而不是让程序员模型自己操心2.3 LLM 天生能理解 Future一个关键发现是现有的 LLM 不需要任何额外训练就能正确处理 future 占位符。模型能够正确地把 future ID 作为参数传递给后续函数调用在 future 被解析后正确地利用注入的具体值继续推理在需要具体值时主动调用 await_future作者推测这种能力来自预训练语料中大量的异步编程模式Promise、async/await、非阻塞 I/O模型已经学会了 “符号句柄稍后解析” 这种思维模式三、实验结果3.1 实验设置对照组同步基线Sequential FC顺序函数调用标准的顺序 FC API每个 turn 最多发出一个函数调用模型阻塞等待结果返回后才能继续解码。无任何并发Parallel FC并行函数调用并行 FC API允许模型在同一个 turn 内发出多个函数调用这些同 turn 调用并发执行。但下一个解码 turn 仍然阻塞直到当前 turn 的所有函数全部返回。跨 turn 无并发实验组AsyncFCAsyncFC(S)在 Sequential FC API 之上叠加 AsyncFC 执行层。底层模型仍然使用顺序 FC 协议每 turn 一个调用但运行时通过 future 机制实现 decode-execution overlap 和跨 turn 的函数间并行AsyncFC(P)在 Parallel FC API 之上叠加 AsyncFC 执行层。底层模型使用并行 FC 协议AsyncFC No-Ann(S)不提供任何依赖标注的 AsyncFC(S) 变体。调度器退化为保守串行执行但仍能获得 decode-execution overlap 收益所有对比都在相同模型主要是 GPT-4o和相同任务集上进行。延迟加速比的统计显著性通过配对 t 检验验证准确率差异通过 McNemar 检验确认无显著退化3.2 BFCL 基准测试在 BFCL v3 Multi-Turn150 个多轮用例注入 5s 函数延迟和 BFCL v4 Web Search真实后端延迟上评估异步 FC 实验组在所有情景中均未表现出统计意义上的准确率差异且在所有设置下均实现了加速3.3 延迟分解分析相比于基准测试实际工作中更可能面临更显著的函数执行延迟和更复杂的步骤交错。所以作者为工具函数添加了不同程度的延迟并观察各组方案的平均耗时可见函数执行耗时越长AsyncFC 的加速效果越明显此外作者还分析了「解码-函数调用重叠」和「函数间并行」两种加速收益的变化趋势可见低函数延迟时 decode-execution overlap 贡献主要收益并逐渐饱和高函数延迟时 inter-function parallelism 成为主导贡献者3.4 跨模型泛化AsyncFC 的 Runtime 搭好后作者还测试切换 LLM 时的鲁棒性把 gpt-4o 模型换成 Gemini 3.1 Pro 后BFCL v3 上也实现了准确率无显著下降的加速3.5 标注鲁棒性尽管完全不提供依赖标注No-Ann 模式时AsyncFC 还是能通过「解码-函数调用重叠」获得加速但标准的实现还是需要开发者手动填好各工具函数的执行信息这存在一定工作量。对此作者还测试了 AsyncFC 对这些执行标注的鲁棒性完全依靠外部 LLM 做一次性离线标注生成在 BFCL v3 上测试结果上看即使用的是不那么准确的 LLM 标注AsyncFC 也实现了 1.22 倍的加速准确率不降接近于上述手工标注效果3.6 下游应用软件工程将 AsyncFC 集成到 SWE-agent 中使用 GPT-5.2 评估。通过规则匹配自动生成依赖标注如python/pytest命令锁定根路径无需人工介入。在 2x 函数延迟缩放下AsyncFC 实现 1.44x 加速且 issue 解决率与基线持平异步思考AsyncFC 天然支持异步思考即将子 Agent 推理视为高延迟函数调用主模型作为协调者把子问题上下文作为参数传给 “思考工具”工具返回推理结果。100 个原始任务组合为 50 个配对工作负载后AsyncFC 实现 1.24x 加速且准确率无损局限与展望工作负载依赖严格串行的任务或函数延迟可忽略的场景AsyncFC 收益有限额外开销await_future 的解码开销在某些情况下可能抵消收益可通过并行解码缓解最佳场景长延迟、写入型操作订票、发邮件、机器人控制物理执行与推理重叠潜在优化beam search 探索不同的函数调用顺序选择能最大化并发吞吐的解码路径

ARM DS-5调试中IMG53警告的解决方案

1. 问题现象解析当使用ARM DS-5开发套件进行嵌入式调试时，开发者可能会在加载调试信息时遇到"WARNING(IMG53): No line debug information in the image"的警告提示。这个警告通常出现在以下两种典型场景中：在Eclipse集成开发环境中&#xff0…

2026/5/19 8:59:32 阅读更多

AI行业的“中年危机”：为什么说AI工程师也有35岁门槛

在科技行业的快速迭代浪潮中，“35岁危机”早已不是新鲜话题。对于人工智能（AI）领域的从业者，尤其是软件测试人员来说，这个节点似乎来得更为迅猛和残酷。当代码的更新速度快于经验的积累，当年轻血液的涌入冲…

2026/5/19 8:59:32 阅读更多

第十三章：R 读取 txt、csv 表格数据

数据分析的第一步永远是读取数据。真实数据通常存储在 CSV、TXT 等文件中，本章将学习如何用 R 读取外部数据文件，以及如何把分析结果导出保存。一、数据文件常见格式格式扩展名特点CSV.csv逗号分隔，最通用的表格格式TXT.txt制表符或自定义…

2026/5/19 8:58:10 阅读更多

【Nginx】Nginx 并发连接数限制（limit_conn）深度解析：从内存模型到云原生防护实践

Nginx 并发连接数限制（limit_conn）深度解析：从内存模型到云原生防护实践本文面向已掌握 Nginx 基础的中高级工程师，深入剖析 limit_conn 模块的工作机制、配置陷阱、性能边界与生产级防护策略。内容基于 Nginx 1.24+ 开源版，适用于 Ubuntu/CentOS、Docker 及 Kubernetes …

2026/5/19 9:46:23 阅读更多

【Nginx】Nginx 请求速率限制（limit_req）深度解析：从漏桶算法到云原生防护实践

Nginx 请求速率限制（limit_req）深度解析：从漏桶算法到云原生防护实践本文面向已掌握 Nginx 基础的中高级工程师，深入剖析 limit_req 模块的工作机制、配置陷阱、性能边界与生产级防护策略。内容基于 Nginx 1.24+ 开源版，适用于 Ubuntu/CentOS、Docker 及 Kubernetes 环境…

2026/5/19 9:46:23 阅读更多

Bootstrap Magic自定义组件开发：扩展你的主题生成能力

Bootstrap Magic自定义组件开发：扩展你的主题生成能力【免费下载链接】bootstrap-magic Bootstrap themes generator made with AngularJS 项目地址: https://gitcode.com/gh_mirrors/bo/bootstrap-magic Bootstrap Magic是一款基于AngularJS构建的Bootstra…

2026/5/19 9:45:43 阅读更多

基于Arduino Yun的嵌入式Web音效板开发实战

1. 项目概述：一个可玩性极高的嵌入式Web音效板如果你手头有一块吃灰的Arduino Yun，或者对如何让一个巴掌大的嵌入式设备变身成一个能联网、有交互的智能终端感兴趣，那么这个项目绝对能让你玩上一下午。它的核心目标很简单：把Ardui…

2026/5/19 9:45:23 阅读更多

ElasticSearch 教程入门到精通，应对故障，路由计算分片控制，数据读写流程，数据更新流程，数据批量操作流程，笔记38、39、40、41、42

ElasticSearch 教程入门到精通，应对故障，路由计算分片控制，数据读写流程，数据更新流程，数据批量操作流程，笔记38、39、40、41、42 一、参考资料【【尚硅谷】ElasticSearch教程入门到精通（基于…

2026/5/19 9:45:23 阅读更多

告别手动调色！用Excel+ArcGIS Pro/SuperMap iDesktop实现CAD控规数据一键自动配色

城市规划师的效率革命：Excel与GIS工具联动的CAD控规数据智能配色方案城市规划师和GIS工程师们，是否厌倦了在CAD控规数据转换过程中反复手动调整颜色的繁琐操作？当面对上百个地块需要逐个匹配RGB值时，不仅效率低下，还容…

2026/5/19 9:45:02 阅读更多

5分钟快速上手：biliTickerBuy开源工具助你轻松抢购B站会员购热门票务

5分钟快速上手：biliTickerBuy开源工具助你轻松抢购B站会员购热门票务【免费下载链接】biliTickerBuy b站会员购购票辅助工具项目地址: https://gitcode.com/GitHub_Trending/bi/biliTickerBuy biliTickerBuy是一款专为B站会员购平台设计的开源辅助工具&…

2026/5/19 0:00:10 阅读更多

一口气讲清楚 Monorepo、Turborepo、pnpm、Changesets 到底是什么？

你肯定遇到过这种情况：项目里同时有前端、后端、公共组件，放在一个仓库嫌乱，拆成多个仓库又改一个公共函数要在五个项目里各改一遍。于是出现了 Monorepo、Turborepo、pnpm、Changesets 这四个词。它们不是互相替代，而是分别解决工…

2026/5/19 0:00:31 阅读更多

从ok-skills项目解析技能树：设计理念、技术实现与工程实践

1. 项目概述与核心价值最近在GitHub上看到一个挺有意思的项目，叫“ok-skills”。光看这个名字，可能有点摸不着头脑，但点进去一看，发现这是一个关于“技能树”或“知识图谱”的开源项目。简单来说，它试图用一种结构化的…

2026/5/19 0:01:12 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/19 4:14:12 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/19 6:17:20 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/19 0:56:48 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/19 0:13:34 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/19 0:00:02 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/18 19:34:27 阅读更多

相关文章