文章目录前言一、算得快AICS灵衢智算集群核心硬核指标二、记得住AMS Agentic记忆存储产品核心优势三、调得动CCE Volcano Next四、安全可靠AgentSphere四层安全防护能力五、ModelArts Next重新定义新一代MaaS平台六、智果园面向硅基智能体的全新云原生入口七、行业AI梦工厂打通Agent最后一公里落地通道7.1 智慧医疗专区7.2 CloudRobo具身智能平台7.3 科学计算专区总结前言近期AI行业迎来重磅事件6月15日华为云上海INSPIRE创想者大会正式召开本次发布会一次性推出多款适配Agent全生命周期的底层基础设施与上层平台产品。当前企业落地智能体普遍存在四大痛点推理响应慢、长上下文易遗忘、多任务算力资源争抢、自主操作存在数据安全隐患。多数开发者会误以为更换更大参数底座模型就能解决问题实则根源在于传统软硬件架构并非为Agent多轮连续决策、长期任务运行场景设计。本次华为云发布四大底层核心产品分别对应算力、记忆、调度、安全四大刚需搭配MaaS开发平台、硅基智能体云入口、垂直行业落地工具链形成一套端到端Agent落地解决方案下文分层拆解各产品核心能力与行业价值。一、算得快AICS灵衢智算集群大模型单次对话推理与Agent多步骤链式推理的算力、Token吞吐需求存在量级差距通用推理集群无法承载智能体高频、连续、低延迟决策场景AICS灵衢智算集群针对性补齐算力短板。核心硬核指标推理端到端时延控制至10ms以内满足实时交互Agent需求集群最大支持10万卡级规模化部署总算力可达200 EFLOPS千卡集群每秒Token吞吐500万高并发场景承载能力拉满在线推理服务稳定可用度99.95%保障企业7×24小时业务运行十万卡级超大规模集群同时兼顾低时延与高吞吐是国产智算云标杆级能力为复杂多智能体协同、高并发企业服务提供底层算力底座。二、记得住AMS Agentic记忆存储长会话、跨天连续业务场景下普通大模型会话上下文窗口有限智能体极易丢失历史信息无法沉淀用户偏好、业务历史经验是企业级Agent落地最大卡点之一AMS专为智能体打造分层长期记忆系统。产品核心优势存储规模支持PB级超大记忆存储空间容量规模领先业界一倍读写性能盘级全新存储架构搭配三合一专用芯片实现TB级高速读取综合性能整体读写、检索性能超越同类产品50%缓存优化DRAM内存池化分层联动设计记忆缓存命中率高达95%简单来说AMS相当于给智能体搭载永久长期记忆即便持续运行数天的长流程业务Agent也能精准调取数日前的对话、业务数据彻底解决智能体“失忆”难题。三、调得动CCE Volcano Next企业AI业务往往同步运行模型训练、在线推理、智能体任务执行、海量存储读写等多种负载CPU、NPU、网络、存储资源容易出现抢占冲突造成资源浪费、任务排队卡顿。CCE Volcano Next作为统一资源调度引擎承担算力资源“交通调度中枢”角色打通通用计算、智能计算、分布式存储资源协同调度实现多负载隔离运行、硬件资源弹性共享。落地实测数据显示接入调度引擎后企业集群整体资源利用率提升30%直接降低硬件采购与云端使用成本。四、安全可靠AgentSphere通用对话模型仅做信息输出而Agent具备工具调用、数据修改、跨系统操作能力随之带来越权操作、核心数据泄露、操作行为无法溯源、恶意指令执行等多重安全风险。AgentSphere为智能体构建独立安全运行沙箱全链路管控行为风险。四层安全防护能力内核级隔离沙箱隔绝智能体与底层服务器敏感资源双向网络访问拦截限制Agent非法外联、内网越界访问会话级精细化权限管控按需开放操作权限实时恶意意图识别拦截提前阻断风险指令同时兼顾轻量化性能沙箱毫秒级启动单集群每分钟支持十万级沙箱创建销毁安全能力不损耗业务并发性能。五、ModelArts Next重新定义新一代MaaS平台四大底层基础设施之外华为云同步升级平台层产品ModelArts Next打破传统单一API调用式MaaS局限面向Agent全流程开发提供一体化能力矩阵四大核心能力覆盖模型选用、调度、数据安全、持续进化全流程全品类模型矩阵DeepSeek、Kimi、GLM等主流开源/商用模型上线即支持接入解决企业多模型选型、快速集成需求。智能模型路由内置三类自适应调度策略任务匹配精准度超95%自动分配最优底座平均降低模型调用成本20%以上。硬件级机密推理依托芯片TEE可信执行环境用户原始数据推理完成自动销毁云平台运维人员无权限读取明文数据解决金融、政务等高敏感场景数据顾虑。RLaaS强化学习服务一键创建强化学习训练任务支持最长10天不间断稳定训练云南交投落地实践中依托该能力交通流量预测模型精度提升约10%实现Agent业务持续迭代优化。六、智果园面向硅基智能体的全新云原生入口本次发布会前瞻性推出全新产品智果园跳出“人操作云平台”的传统设计思路预判未来云资源使用者将从人类转向各类Agent智能体。过往企业部署集群、调整算力、配置服务、运维资源均需要人工操作控制台、调用API或执行命令行智果园提供自然语言交互入口仅需通过对话输入业务目标智能体可自主完成资源采购、环境搭建、应用部署、日常运维全流程操作。该产品重构云平台交互模式云基础设施正式具备被硅基智能体自主调用、管理的能力是面向Agent时代极具前瞻性的产品设计。七、行业AI梦工厂打通Agent最后一公里落地通道算力、存储、调度、安全、开发平台底座全部完善后垂直行业落地工具链决定智能体能否规模化商用。华为云推出“行业AI梦工厂”开放多年沉淀的行业数据集、专用工具链、落地实践方案降低各领域开发者Agent开发门槛目前三大核心专区已对外开放7.1 智慧医疗专区适配各级医疗机构主推少样本轻量化病理AI方案普通办公消费级PC即可完成专属病理模型推理训练所需标注数据仅为传统方案十分之一现已规模化落地全国三甲、市级、县域多层级医院赋能基层医疗AI诊断。7.2 CloudRobo具身智能平台全球首个全链路机器人开发一站式平台覆盖数据生产、模型训练、仿真测试、真机部署完整流程自研双系统VLA视觉力控模型主动预测、精准控制能力达到行业SOTA水准。7.3 科学计算专区聚焦AI4S科研赛道面向生命科学、材料化学、气象海洋等科研场景提供高性能算力与专用AI科研工具加速科研领域模型研发与仿真计算。总结本次华为云发布会并非零散新品迭代而是覆盖底层算力、记忆存储、资源调度、安全隔离、开发MaaS平台、智能体云入口、垂直行业落地的全栈Agent基础设施解决方案系统性解决当前智能体落地全链路卡点。整套方案中两大创新方向最具长期行业价值AMS Agentic记忆存储智能体长期记忆缺失是企业复杂业务落地的核心瓶颈PB级大容量存储95%缓存命中率的分层记忆架构能够支撑跨天、跨流程长任务稳定运行有望大幅拓宽Agent在企业核心业务场景的使用边界。智果园硅基云入口打破人类操作云资源的固有模式实现Agent自主管理云基础设施属于行业超前布局未来开发者无需掌握复杂云运维知识依靠自然语言即可通过智能体完成全部集群搭建与运维工作。你认为当前制约企业级Agent大规模落地的核心障碍是什么对于Agent专用底层算力、记忆存储、智能云入口这类基础设施有哪些看法欢迎评论区交流讨论。
华为云INSPIRE大会全解读:面向Agent时代的完整AI基础设施全家桶
发布时间:2026/6/16 23:12:06
文章目录前言一、算得快AICS灵衢智算集群核心硬核指标二、记得住AMS Agentic记忆存储产品核心优势三、调得动CCE Volcano Next四、安全可靠AgentSphere四层安全防护能力五、ModelArts Next重新定义新一代MaaS平台六、智果园面向硅基智能体的全新云原生入口七、行业AI梦工厂打通Agent最后一公里落地通道7.1 智慧医疗专区7.2 CloudRobo具身智能平台7.3 科学计算专区总结前言近期AI行业迎来重磅事件6月15日华为云上海INSPIRE创想者大会正式召开本次发布会一次性推出多款适配Agent全生命周期的底层基础设施与上层平台产品。当前企业落地智能体普遍存在四大痛点推理响应慢、长上下文易遗忘、多任务算力资源争抢、自主操作存在数据安全隐患。多数开发者会误以为更换更大参数底座模型就能解决问题实则根源在于传统软硬件架构并非为Agent多轮连续决策、长期任务运行场景设计。本次华为云发布四大底层核心产品分别对应算力、记忆、调度、安全四大刚需搭配MaaS开发平台、硅基智能体云入口、垂直行业落地工具链形成一套端到端Agent落地解决方案下文分层拆解各产品核心能力与行业价值。一、算得快AICS灵衢智算集群大模型单次对话推理与Agent多步骤链式推理的算力、Token吞吐需求存在量级差距通用推理集群无法承载智能体高频、连续、低延迟决策场景AICS灵衢智算集群针对性补齐算力短板。核心硬核指标推理端到端时延控制至10ms以内满足实时交互Agent需求集群最大支持10万卡级规模化部署总算力可达200 EFLOPS千卡集群每秒Token吞吐500万高并发场景承载能力拉满在线推理服务稳定可用度99.95%保障企业7×24小时业务运行十万卡级超大规模集群同时兼顾低时延与高吞吐是国产智算云标杆级能力为复杂多智能体协同、高并发企业服务提供底层算力底座。二、记得住AMS Agentic记忆存储长会话、跨天连续业务场景下普通大模型会话上下文窗口有限智能体极易丢失历史信息无法沉淀用户偏好、业务历史经验是企业级Agent落地最大卡点之一AMS专为智能体打造分层长期记忆系统。产品核心优势存储规模支持PB级超大记忆存储空间容量规模领先业界一倍读写性能盘级全新存储架构搭配三合一专用芯片实现TB级高速读取综合性能整体读写、检索性能超越同类产品50%缓存优化DRAM内存池化分层联动设计记忆缓存命中率高达95%简单来说AMS相当于给智能体搭载永久长期记忆即便持续运行数天的长流程业务Agent也能精准调取数日前的对话、业务数据彻底解决智能体“失忆”难题。三、调得动CCE Volcano Next企业AI业务往往同步运行模型训练、在线推理、智能体任务执行、海量存储读写等多种负载CPU、NPU、网络、存储资源容易出现抢占冲突造成资源浪费、任务排队卡顿。CCE Volcano Next作为统一资源调度引擎承担算力资源“交通调度中枢”角色打通通用计算、智能计算、分布式存储资源协同调度实现多负载隔离运行、硬件资源弹性共享。落地实测数据显示接入调度引擎后企业集群整体资源利用率提升30%直接降低硬件采购与云端使用成本。四、安全可靠AgentSphere通用对话模型仅做信息输出而Agent具备工具调用、数据修改、跨系统操作能力随之带来越权操作、核心数据泄露、操作行为无法溯源、恶意指令执行等多重安全风险。AgentSphere为智能体构建独立安全运行沙箱全链路管控行为风险。四层安全防护能力内核级隔离沙箱隔绝智能体与底层服务器敏感资源双向网络访问拦截限制Agent非法外联、内网越界访问会话级精细化权限管控按需开放操作权限实时恶意意图识别拦截提前阻断风险指令同时兼顾轻量化性能沙箱毫秒级启动单集群每分钟支持十万级沙箱创建销毁安全能力不损耗业务并发性能。五、ModelArts Next重新定义新一代MaaS平台四大底层基础设施之外华为云同步升级平台层产品ModelArts Next打破传统单一API调用式MaaS局限面向Agent全流程开发提供一体化能力矩阵四大核心能力覆盖模型选用、调度、数据安全、持续进化全流程全品类模型矩阵DeepSeek、Kimi、GLM等主流开源/商用模型上线即支持接入解决企业多模型选型、快速集成需求。智能模型路由内置三类自适应调度策略任务匹配精准度超95%自动分配最优底座平均降低模型调用成本20%以上。硬件级机密推理依托芯片TEE可信执行环境用户原始数据推理完成自动销毁云平台运维人员无权限读取明文数据解决金融、政务等高敏感场景数据顾虑。RLaaS强化学习服务一键创建强化学习训练任务支持最长10天不间断稳定训练云南交投落地实践中依托该能力交通流量预测模型精度提升约10%实现Agent业务持续迭代优化。六、智果园面向硅基智能体的全新云原生入口本次发布会前瞻性推出全新产品智果园跳出“人操作云平台”的传统设计思路预判未来云资源使用者将从人类转向各类Agent智能体。过往企业部署集群、调整算力、配置服务、运维资源均需要人工操作控制台、调用API或执行命令行智果园提供自然语言交互入口仅需通过对话输入业务目标智能体可自主完成资源采购、环境搭建、应用部署、日常运维全流程操作。该产品重构云平台交互模式云基础设施正式具备被硅基智能体自主调用、管理的能力是面向Agent时代极具前瞻性的产品设计。七、行业AI梦工厂打通Agent最后一公里落地通道算力、存储、调度、安全、开发平台底座全部完善后垂直行业落地工具链决定智能体能否规模化商用。华为云推出“行业AI梦工厂”开放多年沉淀的行业数据集、专用工具链、落地实践方案降低各领域开发者Agent开发门槛目前三大核心专区已对外开放7.1 智慧医疗专区适配各级医疗机构主推少样本轻量化病理AI方案普通办公消费级PC即可完成专属病理模型推理训练所需标注数据仅为传统方案十分之一现已规模化落地全国三甲、市级、县域多层级医院赋能基层医疗AI诊断。7.2 CloudRobo具身智能平台全球首个全链路机器人开发一站式平台覆盖数据生产、模型训练、仿真测试、真机部署完整流程自研双系统VLA视觉力控模型主动预测、精准控制能力达到行业SOTA水准。7.3 科学计算专区聚焦AI4S科研赛道面向生命科学、材料化学、气象海洋等科研场景提供高性能算力与专用AI科研工具加速科研领域模型研发与仿真计算。总结本次华为云发布会并非零散新品迭代而是覆盖底层算力、记忆存储、资源调度、安全隔离、开发MaaS平台、智能体云入口、垂直行业落地的全栈Agent基础设施解决方案系统性解决当前智能体落地全链路卡点。整套方案中两大创新方向最具长期行业价值AMS Agentic记忆存储智能体长期记忆缺失是企业复杂业务落地的核心瓶颈PB级大容量存储95%缓存命中率的分层记忆架构能够支撑跨天、跨流程长任务稳定运行有望大幅拓宽Agent在企业核心业务场景的使用边界。智果园硅基云入口打破人类操作云资源的固有模式实现Agent自主管理云基础设施属于行业超前布局未来开发者无需掌握复杂云运维知识依靠自然语言即可通过智能体完成全部集群搭建与运维工作。你认为当前制约企业级Agent大规模落地的核心障碍是什么对于Agent专用底层算力、记忆存储、智能云入口这类基础设施有哪些看法欢迎评论区交流讨论。