⚡ 第1条NVIDIA发布RTX Spark超级芯片——个人AI计算机迈入千万亿次时代核心信息COMPUTEX 2026首日NVIDIA正式发布RTX Spark超级芯片将Blackwell架构GPU与20核Grace CPU通过NVLink-C2C融合为统一芯片。该芯片配备6144个CUDA核心、第五代Tensor Core支持FP4精度最高可搭载128GB统一内存AI算力达1 Petaflop千万亿次浮点运算/秒。性能指标参数RTX SparkAI算力1 PetaflopCUDA核心6144个CPU20核Arm联发科定制统一内存最高128GB本地运行大模型1200亿参数/100万token上下文上市时间2026年秋季华硕/戴尔/联想/微软Surface首发对开发者/企业的影响单机即可本地运行千亿参数大模型彻底打破跑大模型必须上云的壁垒。超过100家Windows软件商含Adobe、Blackmagic Design已启动适配AI PC生态进入爆发前夜。信息来源腾讯新闻 | 2026-06-02⚡ 第2条黄仁勋预言Marvell成万亿公司高速互联成AI算力新主线核心信息COMPUTEX 2026次日英伟达CEO黄仁勋与Marvell CEO Matt Murphy同台对谈。黄仁勋指出随着Agent AI大规模落地AI计算正从单GPU竞赛进入数据中心协同计算时代——高速互联、交换芯片、光通信的重要性正快速超越GPU本身。他公开称Marvell可能成为下一家万亿美元公司。股价表现标的表现Marvell (MRVL)前日涨超7%夜盘一度暴涨12%英伟达 (NVDA)领涨科技股美股再创新高对开发者/企业的影响AI基础设施投资逻辑正在转向——CPO共封装光学、midplane互联、800V DC电源等连接层技术将成为下一轮算力基建的核心标的。数据中心从买更多GPU变为建更高效的互联网络。信息来源新浪财经 | 2026-06-02⚡ 第3条2026全球AI算力报告发布全球102GW2030年翻倍至220GW核心信息5月29日天津世界智能产业博览会上《2026全球AI算力发展研究报告》重磅发布。报告指出全球算力中心总容量达102GW其中AI负载62GW预计2030年翻倍至220GWAI负载占71%。AI芯片正从GPU向TPU、NPU多元演进算力中心迈入吉瓦级超大规模绿色集群阶段。关键数据指标2026年2030年预测全球算力中心总容量102GW220GWAI负载占比61%71%美国年耗电量292TWh606TWh占全美11%中国算力中心容量—接近60GWAI占48%全球耗电量415TWh2024945TWh年均增15%十大趋势方向算力架构升级、多智能体推理需求爆发、能源供给变革风光储→核能→氢能、太空算力、词元经济学等。信息来源CSDN / 智东西 | 2026-06-01⚡ 第4条中国移动19亿服务器大单落定国产ARM算力加速崛起核心信息中国移动2026-2027年PC服务器集采结果公布武汉长江计算独揽全部4个ARM架构标包税前中标金额超19亿元。截至2026年3月底我国智能算力规模达每秒1882百亿亿次但当前训练算力仍占70-80%未来推理算力预计将占70%以上。产业链景气验证公司算力相关采购/合同金额东阳光160亿-190亿元华策影视不超过33亿元盛视科技约60亿元杰创智能约3.6亿元74只算力概念股年内平均涨幅接近43%融资余额较去年末增加近35%。对开发者/企业的影响运营商级ARM服务器大规模采购标志着国产ARM生态从可用迈向好用华为昇腾、昆仑芯等国产AI芯片的配套服务器部署有望加速。信息来源新浪财经 | 2026-06-02⚡ 第5条小米MiMo-V2.5 API最高降99%大模型价格战进入分时代核心信息5月27日小米宣布MiMo-V2.5系列API永久降价最高降幅达99%。MiMo-V2.5-Pro缓存命中仅0.025元/百万tokens标准版更是低至0.02元。同时取消上下文窗口分级定价Token Plan套餐Token用量提升5-8倍。这是继DeepSeek-V4-Pro永久降价75%后又一家头部厂商加入价格战。价格对比模型缓存命中元/百万tokens输入元/百万tokens输出元/百万tokensMiMo-V2.5-Pro0.02536MiMo-V2.5标准0.02012DeepSeek-V4-Pro0.02536对开发者/企业的影响大模型API已从元时代进入分时代中小企业AI应用开发成本大幅降低。但需注意MiMo-V2-Pro和Omni系列维持原价未参与降价厂商通过价格分层引导开发者迁移至最新架构。信息来源新浪科技 / ITBear | 2026-05-27 本简报由 英辰朗迪GEO整理
AI动态简报之算力基建篇(2026.06.03)
发布时间:2026/6/3 19:30:51
⚡ 第1条NVIDIA发布RTX Spark超级芯片——个人AI计算机迈入千万亿次时代核心信息COMPUTEX 2026首日NVIDIA正式发布RTX Spark超级芯片将Blackwell架构GPU与20核Grace CPU通过NVLink-C2C融合为统一芯片。该芯片配备6144个CUDA核心、第五代Tensor Core支持FP4精度最高可搭载128GB统一内存AI算力达1 Petaflop千万亿次浮点运算/秒。性能指标参数RTX SparkAI算力1 PetaflopCUDA核心6144个CPU20核Arm联发科定制统一内存最高128GB本地运行大模型1200亿参数/100万token上下文上市时间2026年秋季华硕/戴尔/联想/微软Surface首发对开发者/企业的影响单机即可本地运行千亿参数大模型彻底打破跑大模型必须上云的壁垒。超过100家Windows软件商含Adobe、Blackmagic Design已启动适配AI PC生态进入爆发前夜。信息来源腾讯新闻 | 2026-06-02⚡ 第2条黄仁勋预言Marvell成万亿公司高速互联成AI算力新主线核心信息COMPUTEX 2026次日英伟达CEO黄仁勋与Marvell CEO Matt Murphy同台对谈。黄仁勋指出随着Agent AI大规模落地AI计算正从单GPU竞赛进入数据中心协同计算时代——高速互联、交换芯片、光通信的重要性正快速超越GPU本身。他公开称Marvell可能成为下一家万亿美元公司。股价表现标的表现Marvell (MRVL)前日涨超7%夜盘一度暴涨12%英伟达 (NVDA)领涨科技股美股再创新高对开发者/企业的影响AI基础设施投资逻辑正在转向——CPO共封装光学、midplane互联、800V DC电源等连接层技术将成为下一轮算力基建的核心标的。数据中心从买更多GPU变为建更高效的互联网络。信息来源新浪财经 | 2026-06-02⚡ 第3条2026全球AI算力报告发布全球102GW2030年翻倍至220GW核心信息5月29日天津世界智能产业博览会上《2026全球AI算力发展研究报告》重磅发布。报告指出全球算力中心总容量达102GW其中AI负载62GW预计2030年翻倍至220GWAI负载占71%。AI芯片正从GPU向TPU、NPU多元演进算力中心迈入吉瓦级超大规模绿色集群阶段。关键数据指标2026年2030年预测全球算力中心总容量102GW220GWAI负载占比61%71%美国年耗电量292TWh606TWh占全美11%中国算力中心容量—接近60GWAI占48%全球耗电量415TWh2024945TWh年均增15%十大趋势方向算力架构升级、多智能体推理需求爆发、能源供给变革风光储→核能→氢能、太空算力、词元经济学等。信息来源CSDN / 智东西 | 2026-06-01⚡ 第4条中国移动19亿服务器大单落定国产ARM算力加速崛起核心信息中国移动2026-2027年PC服务器集采结果公布武汉长江计算独揽全部4个ARM架构标包税前中标金额超19亿元。截至2026年3月底我国智能算力规模达每秒1882百亿亿次但当前训练算力仍占70-80%未来推理算力预计将占70%以上。产业链景气验证公司算力相关采购/合同金额东阳光160亿-190亿元华策影视不超过33亿元盛视科技约60亿元杰创智能约3.6亿元74只算力概念股年内平均涨幅接近43%融资余额较去年末增加近35%。对开发者/企业的影响运营商级ARM服务器大规模采购标志着国产ARM生态从可用迈向好用华为昇腾、昆仑芯等国产AI芯片的配套服务器部署有望加速。信息来源新浪财经 | 2026-06-02⚡ 第5条小米MiMo-V2.5 API最高降99%大模型价格战进入分时代核心信息5月27日小米宣布MiMo-V2.5系列API永久降价最高降幅达99%。MiMo-V2.5-Pro缓存命中仅0.025元/百万tokens标准版更是低至0.02元。同时取消上下文窗口分级定价Token Plan套餐Token用量提升5-8倍。这是继DeepSeek-V4-Pro永久降价75%后又一家头部厂商加入价格战。价格对比模型缓存命中元/百万tokens输入元/百万tokens输出元/百万tokensMiMo-V2.5-Pro0.02536MiMo-V2.5标准0.02012DeepSeek-V4-Pro0.02536对开发者/企业的影响大模型API已从元时代进入分时代中小企业AI应用开发成本大幅降低。但需注意MiMo-V2-Pro和Omni系列维持原价未参与降价厂商通过价格分层引导开发者迁移至最新架构。信息来源新浪科技 / ITBear | 2026-05-27 本简报由 英辰朗迪GEO整理