Uni - Agent:打破 Agent 应用“系统性断层”,构建通用统一训练框架 Uni - Agent从 Demo 到真实世界的一步最近OpenClaw 等开源 Agent 项目爆火释放出强烈信号Agent 正从“看起来厉害”迈向“真能替人做事”。但热闹背后能支撑复杂通用场景、规模化运行并衔接训练流程的开源基础设施稀缺存在“系统性断层”。许多现有方案在预设任务出色用户让 Agent 完成复杂任务时对框架要求更高。Agent 关注点从“一个 demo 能否跑通”转向“一套框架能否承载真实世界复杂性并支持持续探索与进化”。Uni - Agent 是 veRL 开源团队为通用 Agent 打造的统一训练框架核心目标是构建贯通构建、运行与训练完整流程的系统“Uni”有 Unified 和 Universal 两层含义。veRL 是字节跳动技术团队发起并维护的开源强化学习框架。一、Build面向通用场景的灵活构建具备稳定且通用的抽象是 Agent 走向真实世界的基础Uni - Agent 通过“提取共性释放变化”原则解决。将 Agent 核心能力拆解为 model、tool、env 三个模块在三层都保留扩展能力用户可围绕任务组合和扩展 Agent 能力。例如在 [tutorial] 中实现 arXiv 论文搜索与推荐 Agent新增一个 tool 就完成功能扩展。二、Run支持规模化任务的稳定运行在真实场景应用中处理规模是关键系统稳定同时运行上千个任务更体现能力上限。Uni - Agent 基于火山引擎 veFaaS Sandbox 提供远程沙盒执行方案从安全性、性能、场景适配三个维度支撑。还提供轻量级实时仪表盘支持对大规模任务实时监控。三、Train让 Agent 在真实环境中进化复杂场景下Agent 在环境交互中持续学习和进化推动基模能力演进。Uni - Agent 能让 Agent 运行接入 verl 训练引擎支持前沿高效训练技术并随 verl 迭代。在 Coding Agent 任务实验中用 R2E - Gym 数据集训练 Qwen3 - Coder - 30B 模型模型能力稳定提升。Agent 任务存在长尾效应fully async、partial rollout 等技术适配价值高异步训练效率成倍提升且效果稳定。四、长期愿景希望未来 Agent 能在复杂世界中感知、行动、探索和进化这是 Uni - Agent 的长期愿景。若对通用 Agent、规模化推理、Agent 训练感兴趣可关注和 star Uni - Agent 。