你开启电脑键入一行代码屏幕之上浮现一个模型训练进度条自0%至100%GPU在消耗。你觉得你在运行AI实则你在耗费钱财。真的。一款高端的GPU其价钱能够对标一辆二手的小轿车并且你没办法买到。在2025年时全球GPU市场的产值攻破2800亿美元当中数据中心所使用的GPU占据了60%以上。 这一家公司就占据了超出85%的市场份额每年的出货量快要达到4000万片。每一块宛如印钞机。那么你可曾晓得最为离谱的究竟是什么呢图形处理器最初被设计创造出来的时候压根就不是用于人工智能方面的。它原来是为了能够方便人们玩游戏而设计的呀显卡不卡卡的是你的想象力在1999年的时候推出了 256它号称是“世界上第一款GPU”。其使命在于要让3D游戏当中的怪物变得更加逼真要让子弹特效变得更为炫酷。谁都没有想到历经二十多年后这个东西竟然会成为人工智能的引擎。怎么做到的有着如同大学教授般能力的CPU对各类知识均有所掌握然而却在同一 time 仅能教导一名学生那GPU又如何呢它恰似幼儿园教师那般仅仅会数数可却能够于同一时刻对五十个孩童展开教导AI训练的实质便是数量众多且不断重复的矩阵乘法运算而恰好GPU在这方面最为擅长。比方说。在2012年Alex 借助两块GTX 580训练出了一个名为的神经网络于图像识别竞赛中其错误率相较于第二名低了10个百分点。就在那一年深度学习全面爆发开来了。而GTX 580的算力为1.58 大致每秒能够执行1.58万亿次浮点运算。而今的H100究竟何在呢其单精度算力能够达到60 此乃GTX 580的三十八倍之多。并且其价格已然从三百美元迅猛飙升至三万美元以上了。为什么GPU比黄金还贵你可能会想技术升级了产量大了东西不是应该更便宜吗错了。GPU的制造花费的确是在降低了然而需求增长得更为疯狂速度更快。在2024年的时候全球范围内AI大模型的数量突破了3000个 并且每个大模型在开展训练工作时都需要上万块GPU同时进行运转。据说GPT-4的训练过程中使用了25000块A100 且持续运行了100天。仅仅电费这一项支出就快要接近1亿美元了。更为关键之处在于GPU的制造深切地依赖着台积电的先进封装工艺。在2025年的时候台积电的CoWoS封装月产能仅仅为3.2万片。然而全球订单量却超过了15万片。供需比达不到1:5。这便意味着哪怕你拥有资金也需要进行排队。多长时间会排到队呢2024年的订单曾经是一直延续排放到2025年年底的状态。有一些公司纯粹是借助两倍的价格前往黑市进行扫货的行为。你说说这样的情况贵不贵呢算力不是数字是时间不少人倾向于运用FLOPS去对比GPU的强弱程度然而真正具有关键意义的是“你能够在多长时间之内把这个模型跑完”。一项的基准测试表明于训练BERT模型之际一块A100所需时长为2.8天然而一块H100所需时长仅为1.1天。所节省下来的1.7天若换算成电费、人力以及机会成本或许价值几十万美金。所以大型公司压根不在意单独一块 GPU 的价格高低状况他们仅仅侧重于考量每单位计算能力能够节省下来的具体时间量。可是小团队就并非那般幸运了在2024年有一家初创公司由于买不到GPU所以不得不将模型训练任务外包给云计算平台结果一个月花费了120万美元该团队仅有八个人全都在烧钱。谁在用GPU谁在用命于数据中心之中GPU并非始终保持24小时满负荷运转状态有时它用于运行训练工作有时它被用于进行推理任务有时它处于空转情形然而即便空转状态其也存在耗电状况。一台微波炉的功耗与一张H100的700瓦功耗相近3000张H100一同运行一个小时会消耗2100度电如此一来基于一年的情况GPU本身的费用相比电费反倒更低。考虑散热情况液冷已然成为了符合基本条件需具备的配置了。传统的依靠空气对流散热的风冷方式压根就压制不住功率达到700瓦时所产生的热量。到2025年的时候在全球范围内的数据中心领域里液冷市场的规模实现了突破80亿美元的情况其中超过一半以上的份额是源自GPU集群对于冷却的需求。因此你瞧一块GPU价格高并非仅仅是芯片本身价值不菲。它背后涉及的电力供应、散热措施、网络连接、机房环境每一个相关环节都在耗费大量资金。普通人怎么用得起你可能觉得这东西跟我没关系。但事实是你每天都在用。哪怕是要用GPT去询问一个问题其背后至少得调用数千块GPU来进行推理。哪怕只是去刷短视频那推荐算法同样也是在GPU上面运行的。哪怕仅仅是用手机拍摄了一张照片其中的AI美颜实际上也是在云端的GPU之上完成计算的。只不过这些成本被平台消化了你没直接付钱。然则倘若你身为一名学生欲自行运行一个模型以进行实践呢租赁云GPU一个月的费用大概处于500至2000美元之间。绝大多数人根本没有能力去承担这笔费用。故而当前流行着一种做法去进行拼单。数人共同租用一台GPU服务器依次轮流使用。既能够节省费用又具备较高的效率。在2025年时于国内涌现出了数量超过50家的GPU算力共享平台且其用户量实现了突破200万的情况。其中最小的套餐是按照小时进行租赁的模式每一小时的价格为6块钱。这样的价格听起来是不是会让人觉得颇为便宜呢然而需要注意的是那所使用的是低端显卡。要是使用高端卡的话那么一小时的费用则需要80块。算力会越来越贵吗短期看会。到2025年的时候台积电的3纳米制程良率仅为70%这极大地抬高了GPU的制造成本并且HBM3显存的产能同样处于紧缺状态三星以及SK海力士2025年的订单已然排满。长期看不一定。处于研发进程中的有量子计算还有光子计算以及存算一体芯片。在2024年的时候有一家名为的公司推出了晶圆级芯片该芯片是直接在一大块晶圆上进行集成集成了85万个AI核心。尽管其生态尚不具备成熟的状态不过至少是给算力领域带去了另外一种可能性。而且摩尔定律还没死透——只是慢下来了。最后说一句GPU的算力并非技术所达的终点它仅是在这个时代里最为强硬的货币。无论谁拥有了算力便能够以更快的速度去迭代模型能够以更快的速度去占领市场能够以更快的速度去定义未来。不过说到底算力自身不存在价值。真正具备价值的是你运用算力去开展的事情。是让AI更聪明还是让世界更分裂我不清楚答案然而我明白每次你敲下回车键GPU就在为你作答。你是用来画图的写代码的还是拿来炒币的那块GPU不会说话但它知道。
算力战争背后:GPU到底凭什么这么贵?
发布时间:2026/5/24 16:23:32
你开启电脑键入一行代码屏幕之上浮现一个模型训练进度条自0%至100%GPU在消耗。你觉得你在运行AI实则你在耗费钱财。真的。一款高端的GPU其价钱能够对标一辆二手的小轿车并且你没办法买到。在2025年时全球GPU市场的产值攻破2800亿美元当中数据中心所使用的GPU占据了60%以上。 这一家公司就占据了超出85%的市场份额每年的出货量快要达到4000万片。每一块宛如印钞机。那么你可曾晓得最为离谱的究竟是什么呢图形处理器最初被设计创造出来的时候压根就不是用于人工智能方面的。它原来是为了能够方便人们玩游戏而设计的呀显卡不卡卡的是你的想象力在1999年的时候推出了 256它号称是“世界上第一款GPU”。其使命在于要让3D游戏当中的怪物变得更加逼真要让子弹特效变得更为炫酷。谁都没有想到历经二十多年后这个东西竟然会成为人工智能的引擎。怎么做到的有着如同大学教授般能力的CPU对各类知识均有所掌握然而却在同一 time 仅能教导一名学生那GPU又如何呢它恰似幼儿园教师那般仅仅会数数可却能够于同一时刻对五十个孩童展开教导AI训练的实质便是数量众多且不断重复的矩阵乘法运算而恰好GPU在这方面最为擅长。比方说。在2012年Alex 借助两块GTX 580训练出了一个名为的神经网络于图像识别竞赛中其错误率相较于第二名低了10个百分点。就在那一年深度学习全面爆发开来了。而GTX 580的算力为1.58 大致每秒能够执行1.58万亿次浮点运算。而今的H100究竟何在呢其单精度算力能够达到60 此乃GTX 580的三十八倍之多。并且其价格已然从三百美元迅猛飙升至三万美元以上了。为什么GPU比黄金还贵你可能会想技术升级了产量大了东西不是应该更便宜吗错了。GPU的制造花费的确是在降低了然而需求增长得更为疯狂速度更快。在2024年的时候全球范围内AI大模型的数量突破了3000个 并且每个大模型在开展训练工作时都需要上万块GPU同时进行运转。据说GPT-4的训练过程中使用了25000块A100 且持续运行了100天。仅仅电费这一项支出就快要接近1亿美元了。更为关键之处在于GPU的制造深切地依赖着台积电的先进封装工艺。在2025年的时候台积电的CoWoS封装月产能仅仅为3.2万片。然而全球订单量却超过了15万片。供需比达不到1:5。这便意味着哪怕你拥有资金也需要进行排队。多长时间会排到队呢2024年的订单曾经是一直延续排放到2025年年底的状态。有一些公司纯粹是借助两倍的价格前往黑市进行扫货的行为。你说说这样的情况贵不贵呢算力不是数字是时间不少人倾向于运用FLOPS去对比GPU的强弱程度然而真正具有关键意义的是“你能够在多长时间之内把这个模型跑完”。一项的基准测试表明于训练BERT模型之际一块A100所需时长为2.8天然而一块H100所需时长仅为1.1天。所节省下来的1.7天若换算成电费、人力以及机会成本或许价值几十万美金。所以大型公司压根不在意单独一块 GPU 的价格高低状况他们仅仅侧重于考量每单位计算能力能够节省下来的具体时间量。可是小团队就并非那般幸运了在2024年有一家初创公司由于买不到GPU所以不得不将模型训练任务外包给云计算平台结果一个月花费了120万美元该团队仅有八个人全都在烧钱。谁在用GPU谁在用命于数据中心之中GPU并非始终保持24小时满负荷运转状态有时它用于运行训练工作有时它被用于进行推理任务有时它处于空转情形然而即便空转状态其也存在耗电状况。一台微波炉的功耗与一张H100的700瓦功耗相近3000张H100一同运行一个小时会消耗2100度电如此一来基于一年的情况GPU本身的费用相比电费反倒更低。考虑散热情况液冷已然成为了符合基本条件需具备的配置了。传统的依靠空气对流散热的风冷方式压根就压制不住功率达到700瓦时所产生的热量。到2025年的时候在全球范围内的数据中心领域里液冷市场的规模实现了突破80亿美元的情况其中超过一半以上的份额是源自GPU集群对于冷却的需求。因此你瞧一块GPU价格高并非仅仅是芯片本身价值不菲。它背后涉及的电力供应、散热措施、网络连接、机房环境每一个相关环节都在耗费大量资金。普通人怎么用得起你可能觉得这东西跟我没关系。但事实是你每天都在用。哪怕是要用GPT去询问一个问题其背后至少得调用数千块GPU来进行推理。哪怕只是去刷短视频那推荐算法同样也是在GPU上面运行的。哪怕仅仅是用手机拍摄了一张照片其中的AI美颜实际上也是在云端的GPU之上完成计算的。只不过这些成本被平台消化了你没直接付钱。然则倘若你身为一名学生欲自行运行一个模型以进行实践呢租赁云GPU一个月的费用大概处于500至2000美元之间。绝大多数人根本没有能力去承担这笔费用。故而当前流行着一种做法去进行拼单。数人共同租用一台GPU服务器依次轮流使用。既能够节省费用又具备较高的效率。在2025年时于国内涌现出了数量超过50家的GPU算力共享平台且其用户量实现了突破200万的情况。其中最小的套餐是按照小时进行租赁的模式每一小时的价格为6块钱。这样的价格听起来是不是会让人觉得颇为便宜呢然而需要注意的是那所使用的是低端显卡。要是使用高端卡的话那么一小时的费用则需要80块。算力会越来越贵吗短期看会。到2025年的时候台积电的3纳米制程良率仅为70%这极大地抬高了GPU的制造成本并且HBM3显存的产能同样处于紧缺状态三星以及SK海力士2025年的订单已然排满。长期看不一定。处于研发进程中的有量子计算还有光子计算以及存算一体芯片。在2024年的时候有一家名为的公司推出了晶圆级芯片该芯片是直接在一大块晶圆上进行集成集成了85万个AI核心。尽管其生态尚不具备成熟的状态不过至少是给算力领域带去了另外一种可能性。而且摩尔定律还没死透——只是慢下来了。最后说一句GPU的算力并非技术所达的终点它仅是在这个时代里最为强硬的货币。无论谁拥有了算力便能够以更快的速度去迭代模型能够以更快的速度去占领市场能够以更快的速度去定义未来。不过说到底算力自身不存在价值。真正具备价值的是你运用算力去开展的事情。是让AI更聪明还是让世界更分裂我不清楚答案然而我明白每次你敲下回车键GPU就在为你作答。你是用来画图的写代码的还是拿来炒币的那块GPU不会说话但它知道。