AI 驱动公共云需求增长，但工作负载部署将更灵活

发布时间：2026/6/3 0:37:48

AI 加速云计算需求云架构面临重新设计对于大多数企业而言AI 工作负载会在公共云中停留足够长的时间以实现快速创新。之后企业会寻求最具成本效益和灵活性的方案。AI 显然正在加速对云计算的需求但并非如许多人预期的那样。当下最受关注的并非软件创新实际上为大规模支持 AI 所需的物理基础设施正吸引着巨额资金流入。芯片、网络设备、电力系统和大型数据中心正成为云市场的战略核心云服务提供商们竞相支持模型训练和推理工作负载。据路透社引用的分析显示包括 Alphabet、亚马逊、Meta 和微软在内的美国科技公司预计在 2026 年将在与 AI 相关的基础设施上投入约 6500 亿美元高于 2025 年的约 4100 亿美元。这表明 AI 正促使云架构本身进行重新设计深入到网络和数据传输层面。英伟达最近宣布分别向光子学公司 Lumentum 和 Coherent 投资 20 亿美元凸显了压力点正在浮现。如今的问题不仅是原始计算能力还包括数据如何在处理器、机架和集群之间快速移动同时避免出现不可接受的瓶颈或电力效率低下的情况。随着 AI 系统规模的扩大延迟、吞吐量和能源使用成为首要的经济考量因素。多数 AI 始于公共云企业进行实验时速度比优化更为重要。公共云让团队能够立即使用 GPU、基础模型 API、向量数据库、编排工具、安全控制和集成服务。企业还能迅速启动试点项目无需等待采购周期、数据中心扩建或组建专业的基础设施团队。鉴于不确定性较高公共云通常是第一代 AI 的理想选择。企业尚不清楚哪些用例能创造价值、会产生多少推理流量以及哪种架构模型最终会胜出。在这个阶段能够快速尝试多种方案比从底层基础设施中节省每一分钱更为重要。托管服务可减少阻碍而阻碍是早期采用的大敌。这就是为何公共云环境中对 AI 的初始需求强劲。企业在公共云中构建聊天机器人、副驾驶、知识助手、文档自动化系统和代码生成工具因为云显著降低了进入门槛为 AI 实验提供了计算资源和完整的运行环境。下一代 AI 系统带来新选择企业的第二代 AI 系统则有所不同。一旦某个用例证明了其价值且使用变得持续财务模式就会发生变化。在概念验证阶段看似成本较低的工作负载在生产规模下运行时可能会变得极其昂贵特别是当它依赖于高级 GPU 实例、高性能存储、持续的网络流量以及层层叠加的托管服务时。这时回迁就成为了讨论的话题。企业先在公共云上构建第一代 AI 系统了解哪些方案可行然后将部分工作负载迁回本地或迁移到所谓的新云服务提供商那里这些提供商能以较低成本提供针对 AI 优化的基础设施。当利用率稳定、数据集中程度高、治理要求严格且企业规模足以证明拥有或直接控制基础设施的合理性时本地部署就具有吸引力。当企业仍希望使用外部服务提供商但又不想支付超大规模云服务提供商通常收取的高额费用时新云服务选项就会变得有吸引力。这些专业服务提供商正越来越多地围绕密集的 GPU 容量、更简单的定价以及专门为 AI 而非通用企业 IT 构建的架构来定位自己。这打破了云迁移总是单向的旧观念在 AI 时代工作负载的部署变得更加灵活。企业逐渐认识到适合实验的地方未必适合稳定的生产而且 AI 的经济成本对架构设计的要求比传统企业应用更为严苛。AI 与公共云需求AI 将为公共云计算带来多大的需求呢短期内需求会相当大。每个大型企业的 AI 项目可能都会以有意义的方式利用公共云无论是用于模型开发、训练高峰、集成服务、安全工具还是全球部署。但认为所有需求都会长期锁定在传统超大规模云服务提供商那里那就错了。一些 AI 工作负载将永久留在公共云中因为它们具有突发性、全球分布性、难以预测性或者与云原生服务紧密耦合。其他工作负载特别是那些使用模式稳定、推理量大的工作负载将成为迁移的候选对象。经济因素将比理念更能驱动这些决策。最终可能形成一个更加细分的市场。公共云将主导 AI 采用的前端并在混合运营中继续发挥重要作用。本地环境将重新成为对成本敏感、稳定运行和合规要求高的工作负载的选择。新云服务提供商将作为中间选项发展壮大为那些希望获得外部 AI 计算能力又不想支付超大规模云服务提供商全额费用的企业提供服务。简而言之AI 将增加对公共云的需求但从长远来看也会促使企业更严格地审视哪种方案最为合适。需要考虑的三个因素首先速度和成本是不同的衡量指标。公共云通常是启动 AI 项目最快的方式这种速度具有实际的商业价值。但在试点中胜出的架构在生产阶段可能会超出预算。企业从一开始就需要制定工作负载部署策略即使是从云端起步。其次AI 工作负载的经济成本与传统应用不同。训练、推理、数据传输、存储和模型服务之间的相互作用可能会迅速导致成本意外增加。企业不仅要对计算使用情况进行建模还要考虑利用率模式、网络流量以及围绕核心 AI 架构的托管服务成本。如果不加以规范企业可能会设计出技术上完美但财务上不可持续的系统。最后未来的灵活性比短期便利更为重要。企业应避免将 AI 系统与单一服务提供商的专有架构绑定过紧以免迁移变得困难或无法实现。在这个市场中赢家将是那些保留多种选择的公司它们能够根据经济、法规和业务需求的变化在公共云、本地环境和新兴的新云平台之间转移工作负载。真正的问题不在于云是否会受益而在于每个 AI 工作负载将在云中停留多久。毫无疑问AI 将为公共云计算带来巨大的新需求。对于大多数企业而言AI 工作负载会在云中停留足够长的时间以实现快速创新但不一定会永远留在那里。

AI工具如何真正驱动数据分析闭环？：从数据清洗到洞察生成的7步自动化流水线（附企业级Checklist）

更多请点击： https://kaifayun.com 第一章：AI工具与数据分析整合的范式演进传统数据分析依赖手工特征工程、静态统计模型与批处理流水线，而现代数据智能已转向以AI原生能力驱动的闭环协同范式。这一演进并非简单叠加AI模块，而是…

2026/6/3 0:36:27 阅读更多

Sora 2城市宣传片爆火底层逻辑（2024Q1全国17城实测数据拆解：时长＜90秒+地标动态权重＞63%＝完播率跃升217%）

更多请点击： https://intelliparadigm.com 第一章：Sora 2城市形象宣传的范式革命传统城市形象传播长期依赖航拍视频、实拍纪录片与静态图集，制作周期长、成本高、场景受限。Sora 2 的发布彻底重构了这一链条——它不再仅是生成式视频工具&a…

2026/6/3 0:35:25 阅读更多

Python纯底座重构：拒绝多店串号，独立开发带UI的浏览器指纹隔离系统架构复盘

写在前面的话。圈里很多老朋友经常调侃我：Jax（林焱），你一个干了这么多年的资深自动化架构师，天天在云端折腾微服务、研究底层并发和鉴权逻辑，怎么突然跑去蹚电商店群这摊子沾满泥土气息的“泥腿子”业务了…

2026/6/3 0:34:45 阅读更多

告别激活烦恼：KMS智能激活脚本让你的Windows和Office永久激活

告别激活烦恼：KMS智能激活脚本让你的Windows和Office永久激活【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows系统激活提示而烦恼吗？Office软件功能受限让你…

2026/6/3 1:21:54 阅读更多

esp开发与应用（薄膜键盘的输入）

2026/6/3 1:21:54 阅读更多

华为官网风格前端实战项目：纯原生HTML/CSS/JS实现，含首页、登录页与交互组件

本文还有配套的精品资源，点击获取简介：这个项目用纯HTML5、CSS3和原生JavaScript还原了华为官网的视觉与基础交互效果，不依赖任何框架或外部库。包含完整的首页（index.html）和独立登录页（login.html&am…

2026/6/3 1:21:34 阅读更多

终极指南：如何在OpenWRT路由器上快速搭建iStore软件中心

终极指南：如何在OpenWRT路由器上快速搭建iStore软件中心【免费下载链接】istore 一个 Openwrt 标准的软件中心，纯脚本实现，只依赖Openwrt标准组件。支持其它固件开发者集成到自己的固件里面。更方便入门用户搜索安装插件。The iStore is a a…

2026/6/3 1:19:50 阅读更多

【VibeCoding系列教程07】零代码平台——Bolt.new

我有个朋友，前阵子跟我诉苦，说想学编程，结果打开教程第一页就被"环境配置"四个字劝退了。我说你配置啥了？他说配置了三天，电脑里多了七个报错，少了一个女朋友。这就是传统编程的门槛。你得先装I…

2026/6/3 1:19:09 阅读更多

第十一章降维案例：沪深300指数成分股收益率的主成分分析

案例：沪深300指数成分股收益率的主成分分析案例背景本小节的内容讲解如何使用Python对数据进行PCA主成分分析，使用到的数据有2022年4月到9月的沪深300成分股数据和沪深300指数数据沪深300成分股数据：data.csv沪深300指数数据：H…

2026/6/3 1:17:17 阅读更多

解决Unity打包EXE后Universal Media Player播放RTSP失败：从修改Player Settings到手动修复UMPPostBuilds.cs

Unity打包EXE后Universal Media Player播放RTSP失败的深度修复指南当你在Unity中使用Universal Media Player（UMP）插件成功实现了RTSP流的播放，却在打包EXE后遭遇"无画面"或"找不到库文件"的错误时，这种从开发…

2026/6/3 0:00:49 阅读更多

ESP32工业物联网控制器：4-20mA压力变送器信号采集与处理实战

1. 项目概述与核心价值在工业现场，数据采集的稳定性和准确性是命脉。无论是监测管道压力、罐体液位还是电机转速，我们都需要将物理世界的信号，可靠地转换为控制系统能理解的“语言”。这其中，4-20mA电流环信号堪称工业模拟信号传输…

2026/6/3 0:00:49 阅读更多

基于Arduino与超声波传感器的DIY无人机计时门设计与实现

1. 项目概述：为FPV竞速增添专业感的DIY计时门如果你和我一样，家里有个对FPV无人机着迷的孩子，或者你自己就是个竞速爱好者，那你肯定理解那种想给自家的小型无人机赛道增加点“专业感”的冲动。我们在地下室用纸箱、呼啦圈搭过各种…

2026/6/3 0:00:49 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/2 3:04:55 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/2 3:51:01 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/2 1:12:03 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/2 5:03:37 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/2 0:27:25 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/2 2:18:01 阅读更多

相关文章

AI工具如何真正驱动数据分析闭环？：从数据清洗到洞察生成的7步自动化流水线（附企业级Checklist）

Sora 2城市宣传片爆火底层逻辑（2024Q1全国17城实测数据拆解：时长＜90秒+地标动态权重＞63%＝完播率跃升217%）

Python纯底座重构：拒绝多店串号，独立开发带UI的浏览器指纹隔离系统架构复盘

告别激活烦恼：KMS智能激活脚本让你的Windows和Office永久激活

esp开发与应用（薄膜键盘的输入）

华为官网风格前端实战项目：纯原生HTML/CSS/JS实现，含首页、登录页与交互组件

终极指南：如何在OpenWRT路由器上快速搭建iStore软件中心

【VibeCoding系列教程07】 零代码平台——Bolt.new

第十一章 降维 案例：沪深300指数成分股收益率的主成分分析

解决Unity打包EXE后Universal Media Player播放RTSP失败：从修改Player Settings到手动修复UMPPostBuilds.cs

ESP32工业物联网控制器：4-20mA压力变送器信号采集与处理实战

基于Arduino与超声波传感器的DIY无人机计时门设计与实现

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

【VibeCoding系列教程07】零代码平台——Bolt.new

第十一章降维案例：沪深300指数成分股收益率的主成分分析