AI 加速云计算需求云架构面临重新设计对于大多数企业而言AI 工作负载会在公共云中停留足够长的时间以实现快速创新。之后企业会寻求最具成本效益和灵活性的方案。AI 显然正在加速对云计算的需求但并非如许多人预期的那样。当下最受关注的并非软件创新实际上为大规模支持 AI 所需的物理基础设施正吸引着巨额资金流入。芯片、网络设备、电力系统和大型数据中心正成为云市场的战略核心云服务提供商们竞相支持模型训练和推理工作负载。据路透社引用的分析显示包括 Alphabet、亚马逊、Meta 和微软在内的美国科技公司预计在 2026 年将在与 AI 相关的基础设施上投入约 6500 亿美元高于 2025 年的约 4100 亿美元。这表明 AI 正促使云架构本身进行重新设计深入到网络和数据传输层面。英伟达最近宣布分别向光子学公司 Lumentum 和 Coherent 投资 20 亿美元凸显了压力点正在浮现。如今的问题不仅是原始计算能力还包括数据如何在处理器、机架和集群之间快速移动同时避免出现不可接受的瓶颈或电力效率低下的情况。随着 AI 系统规模的扩大延迟、吞吐量和能源使用成为首要的经济考量因素。多数 AI 始于公共云企业进行实验时速度比优化更为重要。公共云让团队能够立即使用 GPU、基础模型 API、向量数据库、编排工具、安全控制和集成服务。企业还能迅速启动试点项目无需等待采购周期、数据中心扩建或组建专业的基础设施团队。鉴于不确定性较高公共云通常是第一代 AI 的理想选择。企业尚不清楚哪些用例能创造价值、会产生多少推理流量以及哪种架构模型最终会胜出。在这个阶段能够快速尝试多种方案比从底层基础设施中节省每一分钱更为重要。托管服务可减少阻碍而阻碍是早期采用的大敌。这就是为何公共云环境中对 AI 的初始需求强劲。企业在公共云中构建聊天机器人、副驾驶、知识助手、文档自动化系统和代码生成工具因为云显著降低了进入门槛为 AI 实验提供了计算资源和完整的运行环境。下一代 AI 系统带来新选择企业的第二代 AI 系统则有所不同。一旦某个用例证明了其价值且使用变得持续财务模式就会发生变化。在概念验证阶段看似成本较低的工作负载在生产规模下运行时可能会变得极其昂贵特别是当它依赖于高级 GPU 实例、高性能存储、持续的网络流量以及层层叠加的托管服务时。这时回迁就成为了讨论的话题。企业先在公共云上构建第一代 AI 系统了解哪些方案可行然后将部分工作负载迁回本地或迁移到所谓的新云服务提供商那里这些提供商能以较低成本提供针对 AI 优化的基础设施。当利用率稳定、数据集中程度高、治理要求严格且企业规模足以证明拥有或直接控制基础设施的合理性时本地部署就具有吸引力。当企业仍希望使用外部服务提供商但又不想支付超大规模云服务提供商通常收取的高额费用时新云服务选项就会变得有吸引力。这些专业服务提供商正越来越多地围绕密集的 GPU 容量、更简单的定价以及专门为 AI 而非通用企业 IT 构建的架构来定位自己。这打破了云迁移总是单向的旧观念在 AI 时代工作负载的部署变得更加灵活。企业逐渐认识到适合实验的地方未必适合稳定的生产而且 AI 的经济成本对架构设计的要求比传统企业应用更为严苛。AI 与公共云需求AI 将为公共云计算带来多大的需求呢短期内需求会相当大。每个大型企业的 AI 项目可能都会以有意义的方式利用公共云无论是用于模型开发、训练高峰、集成服务、安全工具还是全球部署。但认为所有需求都会长期锁定在传统超大规模云服务提供商那里那就错了。一些 AI 工作负载将永久留在公共云中因为它们具有突发性、全球分布性、难以预测性或者与云原生服务紧密耦合。其他工作负载特别是那些使用模式稳定、推理量大的工作负载将成为迁移的候选对象。经济因素将比理念更能驱动这些决策。最终可能形成一个更加细分的市场。公共云将主导 AI 采用的前端并在混合运营中继续发挥重要作用。本地环境将重新成为对成本敏感、稳定运行和合规要求高的工作负载的选择。新云服务提供商将作为中间选项发展壮大为那些希望获得外部 AI 计算能力又不想支付超大规模云服务提供商全额费用的企业提供服务。简而言之AI 将增加对公共云的需求但从长远来看也会促使企业更严格地审视哪种方案最为合适。需要考虑的三个因素首先速度和成本是不同的衡量指标。公共云通常是启动 AI 项目最快的方式这种速度具有实际的商业价值。但在试点中胜出的架构在生产阶段可能会超出预算。企业从一开始就需要制定工作负载部署策略即使是从云端起步。其次AI 工作负载的经济成本与传统应用不同。训练、推理、数据传输、存储和模型服务之间的相互作用可能会迅速导致成本意外增加。企业不仅要对计算使用情况进行建模还要考虑利用率模式、网络流量以及围绕核心 AI 架构的托管服务成本。如果不加以规范企业可能会设计出技术上完美但财务上不可持续的系统。最后未来的灵活性比短期便利更为重要。企业应避免将 AI 系统与单一服务提供商的专有架构绑定过紧以免迁移变得困难或无法实现。在这个市场中赢家将是那些保留多种选择的公司它们能够根据经济、法规和业务需求的变化在公共云、本地环境和新兴的新云平台之间转移工作负载。真正的问题不在于云是否会受益而在于每个 AI 工作负载将在云中停留多久。毫无疑问AI 将为公共云计算带来巨大的新需求。对于大多数企业而言AI 工作负载会在云中停留足够长的时间以实现快速创新但不一定会永远留在那里。
AI 驱动公共云需求增长,但工作负载部署将更灵活
发布时间:2026/6/3 0:37:48
AI 加速云计算需求云架构面临重新设计对于大多数企业而言AI 工作负载会在公共云中停留足够长的时间以实现快速创新。之后企业会寻求最具成本效益和灵活性的方案。AI 显然正在加速对云计算的需求但并非如许多人预期的那样。当下最受关注的并非软件创新实际上为大规模支持 AI 所需的物理基础设施正吸引着巨额资金流入。芯片、网络设备、电力系统和大型数据中心正成为云市场的战略核心云服务提供商们竞相支持模型训练和推理工作负载。据路透社引用的分析显示包括 Alphabet、亚马逊、Meta 和微软在内的美国科技公司预计在 2026 年将在与 AI 相关的基础设施上投入约 6500 亿美元高于 2025 年的约 4100 亿美元。这表明 AI 正促使云架构本身进行重新设计深入到网络和数据传输层面。英伟达最近宣布分别向光子学公司 Lumentum 和 Coherent 投资 20 亿美元凸显了压力点正在浮现。如今的问题不仅是原始计算能力还包括数据如何在处理器、机架和集群之间快速移动同时避免出现不可接受的瓶颈或电力效率低下的情况。随着 AI 系统规模的扩大延迟、吞吐量和能源使用成为首要的经济考量因素。多数 AI 始于公共云企业进行实验时速度比优化更为重要。公共云让团队能够立即使用 GPU、基础模型 API、向量数据库、编排工具、安全控制和集成服务。企业还能迅速启动试点项目无需等待采购周期、数据中心扩建或组建专业的基础设施团队。鉴于不确定性较高公共云通常是第一代 AI 的理想选择。企业尚不清楚哪些用例能创造价值、会产生多少推理流量以及哪种架构模型最终会胜出。在这个阶段能够快速尝试多种方案比从底层基础设施中节省每一分钱更为重要。托管服务可减少阻碍而阻碍是早期采用的大敌。这就是为何公共云环境中对 AI 的初始需求强劲。企业在公共云中构建聊天机器人、副驾驶、知识助手、文档自动化系统和代码生成工具因为云显著降低了进入门槛为 AI 实验提供了计算资源和完整的运行环境。下一代 AI 系统带来新选择企业的第二代 AI 系统则有所不同。一旦某个用例证明了其价值且使用变得持续财务模式就会发生变化。在概念验证阶段看似成本较低的工作负载在生产规模下运行时可能会变得极其昂贵特别是当它依赖于高级 GPU 实例、高性能存储、持续的网络流量以及层层叠加的托管服务时。这时回迁就成为了讨论的话题。企业先在公共云上构建第一代 AI 系统了解哪些方案可行然后将部分工作负载迁回本地或迁移到所谓的新云服务提供商那里这些提供商能以较低成本提供针对 AI 优化的基础设施。当利用率稳定、数据集中程度高、治理要求严格且企业规模足以证明拥有或直接控制基础设施的合理性时本地部署就具有吸引力。当企业仍希望使用外部服务提供商但又不想支付超大规模云服务提供商通常收取的高额费用时新云服务选项就会变得有吸引力。这些专业服务提供商正越来越多地围绕密集的 GPU 容量、更简单的定价以及专门为 AI 而非通用企业 IT 构建的架构来定位自己。这打破了云迁移总是单向的旧观念在 AI 时代工作负载的部署变得更加灵活。企业逐渐认识到适合实验的地方未必适合稳定的生产而且 AI 的经济成本对架构设计的要求比传统企业应用更为严苛。AI 与公共云需求AI 将为公共云计算带来多大的需求呢短期内需求会相当大。每个大型企业的 AI 项目可能都会以有意义的方式利用公共云无论是用于模型开发、训练高峰、集成服务、安全工具还是全球部署。但认为所有需求都会长期锁定在传统超大规模云服务提供商那里那就错了。一些 AI 工作负载将永久留在公共云中因为它们具有突发性、全球分布性、难以预测性或者与云原生服务紧密耦合。其他工作负载特别是那些使用模式稳定、推理量大的工作负载将成为迁移的候选对象。经济因素将比理念更能驱动这些决策。最终可能形成一个更加细分的市场。公共云将主导 AI 采用的前端并在混合运营中继续发挥重要作用。本地环境将重新成为对成本敏感、稳定运行和合规要求高的工作负载的选择。新云服务提供商将作为中间选项发展壮大为那些希望获得外部 AI 计算能力又不想支付超大规模云服务提供商全额费用的企业提供服务。简而言之AI 将增加对公共云的需求但从长远来看也会促使企业更严格地审视哪种方案最为合适。需要考虑的三个因素首先速度和成本是不同的衡量指标。公共云通常是启动 AI 项目最快的方式这种速度具有实际的商业价值。但在试点中胜出的架构在生产阶段可能会超出预算。企业从一开始就需要制定工作负载部署策略即使是从云端起步。其次AI 工作负载的经济成本与传统应用不同。训练、推理、数据传输、存储和模型服务之间的相互作用可能会迅速导致成本意外增加。企业不仅要对计算使用情况进行建模还要考虑利用率模式、网络流量以及围绕核心 AI 架构的托管服务成本。如果不加以规范企业可能会设计出技术上完美但财务上不可持续的系统。最后未来的灵活性比短期便利更为重要。企业应避免将 AI 系统与单一服务提供商的专有架构绑定过紧以免迁移变得困难或无法实现。在这个市场中赢家将是那些保留多种选择的公司它们能够根据经济、法规和业务需求的变化在公共云、本地环境和新兴的新云平台之间转移工作负载。真正的问题不在于云是否会受益而在于每个 AI 工作负载将在云中停留多久。毫无疑问AI 将为公共云计算带来巨大的新需求。对于大多数企业而言AI 工作负载会在云中停留足够长的时间以实现快速创新但不一定会永远留在那里。