26年规模最大的IPO：世界最大芯片，挑战英伟达推理霸主地位

发布时间：2026/5/18 19:57:21

2026年5月14日Cerebras Systems在纳斯达克上市以每股185美元的价格发行3000万股筹集55.5亿美元成为2026年迄今规模最大的IPO。首日股价盘中一度暴涨108%市值突破千亿美元大关。彭博社Bloomberg报道称此次IPO的“需求超出供给超过20倍”导致公司在最终定价时大幅上调了发行价格。这家创立于2015年的芯片公司凭借其革命性的晶圆级引擎Wafer-Scale Engine技术正在挑战英伟达在AI芯片领域的霸主地位。Cerebras的上市历程可谓一波三折。公司2024年9月向美国证券交易委员会SEC提交了S-1注册文件但此后因美国外国投资委员会CFIUS对其阿联酋客户G42的投资审查而被迫撤回申请。直到2025年3月CFIUS审查通过后上市通道才重新打开。Cerebras于2026年4月重新提交了注册文件此时的公司面貌已与2024年大不相同。新的OpenAI合作、AWS伙伴关系以及快速增长的云端推理业务构成了一个更为多元化和引人注目的增长故事。自2022年以来受宏观经济不确定性和高利率环境影响全球科技企业IPO数量大幅萎缩。Cerebras的现象级表现为整个科技IPO市场注入了一剂强心针。市场普遍将Cerebras的上市视为2026年AI相关企业上市潮的序幕。SpaceX、OpenAI、Anthropic、Databricks等AI独角兽均被市场传闻正在筹备上市。在这样一个背景下Cerebras的市场表现将在很大程度上影响后续AI企业IPO的定价策略和投资者热情。Cerebras 创立与发展Cerebras Systems于2015年在美国加利福尼亚州森尼韦尔Sunnyvale创立创始团队由五位核心成员组成安德鲁·费尔德曼Andrew Feldman、加里·劳特巴赫Gary Lauterbach、迈克尔·詹姆斯Michael James、肖恩·李Sean Lie和让-菲利普·弗里克Jean-Philippe Fricker。这五位创始人有着深厚的技术渊源他们此前都在SeaMicro共事。SeaMicro是费尔德曼和劳特巴赫于2007年联合创立的一家专注于节能微服务器的创业公司于2012年被AMD以3.34亿美元收购。SeaMicro的成功证明了创始人团队在芯片架构和数据中心技术领域的深厚积累。Cerebras的创立源于一个大胆而近乎疯狂的技术愿景将整块硅晶圆作为一颗芯片来使用。在半导体行业75年的历史中标准做法是将一块硅晶圆约唱片大小上印刻数百颗相同的芯片然后将它们切割开来分别封装和出售。芯片之所以做得小是因为硅晶圆制造过程中不可避免地会产生微小缺陷芯片面积越大缺陷落在其内部的概率就越高整颗芯片报废的风险就越大。因此行业惯例是将芯片控制在邮票大小左右最大约815平方毫米受限于光刻机掩模版尺寸。Cerebras反其道而行之。创始人团队在2015年就预见到了AI工作负载的本质特征计算不是瓶颈数据搬运才是。在GPU集群中大量时间和能量被消耗在芯片之间的数据传输上而非实际的计算操作。如果能将所有计算单元集中在一块巨大的芯片上让数据永远不需要离开芯片就能从根本上消除这一瓶颈。然而将整块晶圆变成一颗可工作的芯片面临着前所未有的工程挑战。首先晶圆制造中的缺陷问题。任何一颗微小缺陷都可能毁掉整块晶圆芯片。Cerebras通过开发容错架构解决了这一问题利用冗余计算模块绕过制造缺陷其原理类似于超大规模数据中心处理服务器故障的方式。其次是芯片封装和散热问题。一块餐盘大小的芯片功率消耗高达25千瓦如果不采取特殊散热措施芯片会在启动瞬间熔毁。Cerebras发明了专用的水冷系统并解决了硅芯片与主板之间的大面积粘合、供电和数据管道传输等一系列封装工程难题。据Observer杂志报道公司一度每月烧掉800万美元花了2亿美元试图解决封装问题甚至在早期需要发明一台能够同时将40颗螺丝钻入晶圆而不使其破裂的专用机器。Cerebras的早期商业化之路异常艰难。公司在S-1文件中坦言早期阶段AI尚处于萌芽状态原始且未经证实。训练耗时漫长是少数人的“黑艺术”。GPU尚未成为瓶颈。而Cerebras的解决方案找不到市场。直到2022年Cerebras的年收入仅为2500万美元主要来自少数生命科学领域的客户。在当时的硅谷几乎没有多少人看好这家坚持走晶圆级路线的偏执狂公司。然而转折来得迅猛而猛烈。随着ChatGPT在2022年底横空出世大语言模型浪潮席卷全球AI推理Inference迅速成为AI计算中最重要、增长最快的负载类型。而Cerebras的晶圆级架构恰恰在推理场景中展现出压倒性优势推理的本质是逐个生成token每次生成都需要将整个模型的权重从内存搬运到计算单元这是一个本质上串行的过程无法通过增加GPU数量来加速。因此内存带宽成为推理速度的决定性因素而Cerebras的晶圆级芯片提供了远超任何GPU集群的片上内存带宽。这一技术洞察的正确性得到了市场的验证。到了2025年Cerebras的收入飙升至5.1亿美元同比增长76%较2024年的2.9亿美元和2022年的区区2500万美元实现了质的飞跃。更重要的是公司在2025年实现了2.378亿美元的GAAP净利润2024年净亏损4.816亿美元净利率约为47%。VentureBeat的分析进一步指出Cerebras的财务改善趋势在2026年上半年仍在加速。随着OpenAI合同开始贡献收入以及云端推理服务用户基础的持续扩大市场分析师普遍预计Cerebras 2026年的收入将达到8亿美元左右同比增长约57%。在IPO前的私人市场融资中Cerebras累计筹集了超过20亿美元。这一数字在半导体创业公司中极为罕见。G轮2025年9月的领投方Fidelity和Atreides Management是华尔街最具影响力的机构投资者之一。这一轮11亿美元的融资获得了超额认购将公司估值推升至81亿美元。H轮2026年2月的领投方Tiger Global则是全球最激进的增长型科技投资者之一其领投将估值在短短五个月内推升至约230亿美元近乎三倍的估值飞跃。此轮的参与方阵容豪华包括BenchmarkCerebras最大机构股东持有1760万股、Fidelity、Atreides、Alpha Wave、Altimeter、AMD、Coatue和1789 Capital。根据Wikipedia和S-1文件IPO前的主要股东结构为Benchmark1760万股、Foundation Capital1530万股、Eclipse Ventures Fund 11350万股、Alpha Wave1210万股、安德鲁·费尔德曼本人1010万股、肖恩·李530万股、G42350万股。此外OpenAI持有购买3340万股的认股权证warrants但行使条件是OpenAI需按约定购买Cerebras的计算能力。Cerebras发展历程中一个不可回避的话题是其与阿联酋人工智能公司G42的深度关联。在2023年和2024年上半年G42一度占Cerebras硬件销售收入的95%至97%。这种极端的客户集中度在美国国家安全审查日益严格的背景下引发了严重的监管担忧。CFIUS美国外国投资委员会对G42持有Cerebras少数股权一事进行了审查这一审查成为阻碍Cerebras在2024年完成IPO的主要障碍。2025年3月CFIUS正式批准了G42持有其少数投资的请求扫清了上市道路上的最大监管障碍。此后Cerebras积极多元化其客户基础到2025年G42相关收入通过MBZUAI和G42两个实体合计约占年收入的86%虽然仍然偏高但较2024年的近100%已有明显改善。2026年1月Cerebras宣布与OpenAI签署了一份价值超过100亿美元后扩大至超过200亿美元的多年度计算协议覆盖750兆瓦AI推理算力有效期至2028年。这一合作从根本上改变了Cerebras的客户构成引入了一个总部位于美国的蓝筹客户在规模上足以彻底重塑公司的收入结构。世界最大商用芯片Cerebras的核心产品是晶圆级引擎Wafer-Scale EngineWSE系列芯片及其搭载的计算系统。截至目前Cerebras已经推出了三代晶圆级引擎WSE第一代 Cerebras的首款产品首次证明了晶圆级集成的商业可行性。虽然具体参数未完全公开但其技术突破意义在于——在半导体行业75年历史上从未有公司成功将整块晶圆作为一颗可工作的商用芯片推向市场。WSE-2第二代集成了2.6万亿个晶体管、85万个AI优化计算核心拥有40GB片上SRAM静态随机存取存储器。WSE-2相比第一代在晶体管数量和计算核心数量上都有大幅提升。WSE-3第三代当前旗舰 Cerebras目前的巅峰之作也是目前世界上最大的商用AI芯片其核心参数令人震撼要真正理解Cerebras的技术价值需要深入理解AI推理的计算特征与半导体物理之间的关系。正如Mostly Metrics在一篇S-1深度分析中生动地比喻的想象一个装满会计师的巨大房间每个会计师都能做数学题但每次完成计算后他们必须走到大厅另一端把结果交给另一位会计师才能继续工作。数学计算本身并不困难但他们走得太慢了走路消耗了他们大量的时间和精力。Cerebras的做法是把90万个会计师放在同一个房间里的同一块硅片上这样数据就永远不需要走到任何地方。WSE-3芯片被封装在Cerebras的CS-3计算系统中。CS-3是一个完整的机架式系统包含芯片封装、供电、水冷和数据输入/输出I/O等全部基础设施。单台CS-3系统内含一颗WSE-3芯片可实现125 PFLOPS千万亿次浮点运算每秒的AI计算性能。更重要的是CS-3系统支持线性扩展。通过将多达2048台CS-3节点组成集群Cerebras声称可实现高达256 EFLOPS百亿亿次浮点运算每秒的聚合AI计算性能。这种可扩展性使Cerebras能够满足从中小型研究实验室到超大规模云计算服务商的各类需求。Cerebras声称在多项基准测试中单台CS-3系统的性能是英伟达旗舰DGX B200系统的21倍而成本和功耗仅为后者的三分之一。在开源模型推理任务中Cerebras的推理速度据称是最快GPU方案的15倍以上。独立基准测试机构Artificial Analysis的多项测试一致将Cerebras评为全球最快的AI推理服务商。在一项碳捕获模型的训练任务中Cerebras实现了较英伟达H100高达210倍的加速。2024年以来Cerebras的业务模式从纯粹的硬件销售转向云端推理服务平台。Cerebras的云端推理API服务允许开发者和企业直接通过互联网访问其算力无需购买昂贵的硬件设备。2025年Cerebras的云端推理服务收入达到1.52亿美元增长势头强劲。公司首席营销官朱莉·蔡Julie Choi在IPO当天接受VentureBeat采访时表示公司计划将IPO募集的新资本用于用Cerebras系统填满更多数据中心为全球最快的推理提供动力。此外Cerebras的云端推理服务也已上架AWS Marketplace亚马逊云服务市场AWS客户可以直接在亚马逊的云平台上采购Cerebras的推理服务。美国AI芯片市场格局英伟达毫无疑问的市场领导者在训练和推理两个领域均占据主导地位。其核心竞争力在于CUDA软件生态的深度和广度以及持续快速的产品迭代能力Hopper、Blackwell、Rubin、Rubin Ultra的产品路线图清晰且执行有力。AMD的MI300X已经在部分AI工作负载中展现出与英伟达H100相媲美的性能且价格通常更有竞争力。值得注意的是AMD同时是Cerebras的H轮投资者和英伟达的竞争对手这一微妙的关系反映了AMD对多元化AI计算生态的战略押注。AMD的ROCm软件平台虽然在成熟度上不及CUDA但在开源社区的支持下正在快速进步。Groq则另一家走专用推理芯片路线的创业公司采用LPULanguage Processing Unit架构专注于低延迟推理。与Cerebras类似Groq也在推理速度上宣称大幅超越GPU方案。两家公司在推理市场的直接竞争不可避免。谷歌自研的AI加速器芯片TPU主要用于谷歌内部的AI服务如Gemini、Google Search的AI功能等但通过Google Cloud对外提供。英特尔Gaudi系列AI加速器是英特尔在AI芯片市场的主要产品线但在性能和市场渗透方面一直未能对英伟达构成实质性威胁。不过英特尔在先进封装和制造工艺方面的能力仍然是不可忽视的潜在竞争优势。在这个竞争格局中Cerebras是唯一一家成功将晶圆级集成商业化的公司在推理延迟和带宽方面拥有独特的结构性优势。如果晶圆级架构被证明是AI计算的未来方向之一那么Cerebras或成为英伟达有力的市场挑战者。

嵌入式SET卡牌游戏开发：从RP2350硬件到CircuitPython游戏逻辑全解析

1. 项目概述：当经典卡牌游戏遇上嵌入式硬件作为一名在嵌入式系统和游戏开发交叉领域摸爬滚打了十来年的开发者，我始终对“在资源受限的硬件上实现复杂逻辑”这件事抱有极大的热情。这次的项目，就是将经典的SET卡牌游戏，完整地移植…

2026/5/18 19:57:21 阅读更多

树莓派驱动MAX31855热电偶传感器：从SPI通信到高精度测温实践

1. 项目概述：从热电偶到Python读数在嵌入式开发、工业监控或者任何需要精确测温的项目里，热电偶（Thermocouple）往往是工程师们的首选传感器。它结构简单、皮实耐用，而且测温范围能从零下两百多度一直覆盖到上千度&…

2026/5/18 19:57:00 阅读更多

5分钟快速上手：Citra 3DS模拟器终极安装指南

5分钟快速上手：Citra 3DS模拟器终极安装指南【免费下载链接】citra A Nintendo 3DS Emulator 项目地址: https://gitcode.com/GitHub_Trending/ci/citra 想要在电脑上畅玩任天堂3DS游戏吗？Citra模拟器是你的最佳选择！作为一款开源的任…

2026/5/18 19:56:40 阅读更多

Markmap技术架构解析：从Markdown到动态思维导图的全链路实现

Markmap技术架构解析：从Markdown到动态思维导图的全链路实现【免费下载链接】markmap Build mindmaps with plain text 项目地址: https://gitcode.com/gh_mirrors/ma/markmap 在信息爆炸的时代，如何将结构化的文本知识转化为直观的视觉呈现&…

2026/5/18 20:36:44 阅读更多

从simple_pjsua.c入手，5步搞定你的第一个PJSIP VoIP通话程序（附完整代码解析）

从simple_pjsua.c入手，5步构建你的首个PJSIP VoIP通话系统在开源通信领域，PJSIP以其轻量级、跨平台和高扩展性成为构建实时音视频应用的利器。simple_pjsua.c作为PJSIP代码库中的经典示例，浓缩了SIP协议栈的核心功能，是开发者快速…

2026/5/18 20:36:03 阅读更多

在多租户 SaaS 平台中集成 Taotoken 实现客户级的 AI 能力与用量隔离

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度在多租户 SaaS 平台中集成 Taotoken 实现客户级的 AI 能力与用量隔离为 SaaS 平台的每个租户提供可配置的 AI 功能，是…

2026/5/18 20:36:03 阅读更多

Windows风扇控制终极指南：Fan Control让你的电脑更静音更高效

Windows风扇控制终极指南：Fan Control让你的电脑更静音更高效【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Tren…

2026/5/18 20:35:22 阅读更多

别只装AlexNet了！手把手教你在MATLAB里玩转更多预训练模型（VGG, ResNet, MobileNet安装指南）

别只装AlexNet了！手把手教你在MATLAB里玩转更多预训练模型（VGG, ResNet, MobileNet安装指南） 当你第一次在MATLAB中调用alexnet函数时，那种"开箱即用"的体验确实令人惊艳。但就像一位米其林大厨不会只满足于使用基础厨具…

2026/5/18 20:35:22 阅读更多

3步搞定抖音资源下载：免费高效的douyin-downloader完整指南

3步搞定抖音资源下载：免费高效的douyin-downloader完整指南【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback …

2026/5/18 20:35:22 阅读更多

精益管理推不动？找准根源+避坑指南，破解全员参与难题

很多工厂推行精益管理，都陷入了管理层热、员工冷的尴尬困境：管理层耗费大量精力制定精益方案、投入资源，却始终推不动，一线员工要么被动应付，要么抵触反抗，不主动识别浪费、不参与改善，精益落地…

2026/5/18 10:35:25 阅读更多

基于React与Zustand构建现代化个人站点导航器：从设计到部署全解析

1. 项目概述：一个现代站点导航器的诞生最近在整理自己的浏览器书签和常用工具时，我发现自己陷入了一个典型的“数字混乱”状态。收藏夹里塞满了各种链接，从开发文档、设计资源到日常工具，杂乱无章。每次想找一个特定的网站&#x…

2026/5/18 10:35:25 阅读更多

开发团队如何通过 Taotoken 实现 API 密钥的统一管理与审计

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度开发团队如何通过 Taotoken 实现 API 密钥的统一管理与审计对于开发团队而言，安全、高效地管理大模型 API 密钥是一项…

2026/5/18 10:36:06 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/18 3:09:38 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/18 4:43:33 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/18 0:20:39 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/17 23:53:35 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/17 23:54:13 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/18 19:34:27 阅读更多

相关文章

嵌入式SET卡牌游戏开发：从RP2350硬件到CircuitPython游戏逻辑全解析

树莓派驱动MAX31855热电偶传感器：从SPI通信到高精度测温实践

5分钟快速上手：Citra 3DS模拟器终极安装指南

Markmap技术架构解析：从Markdown到动态思维导图的全链路实现

从simple_pjsua.c入手，5步搞定你的第一个PJSIP VoIP通话程序（附完整代码解析）

在多租户 SaaS 平台中集成 Taotoken 实现客户级的 AI 能力与用量隔离

Windows风扇控制终极指南：Fan Control让你的电脑更静音更高效

别只装AlexNet了！手把手教你在MATLAB里玩转更多预训练模型（VGG, ResNet, MobileNet安装指南）

3步搞定抖音资源下载：免费高效的douyin-downloader完整指南

精益管理推不动？找准根源+避坑指南，破解全员参与难题

基于React与Zustand构建现代化个人站点导航器：从设计到部署全解析

开发团队如何通过 Taotoken 实现 API 密钥的统一管理与审计

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

py每日spider案例之某website之xin东方选课搜索接口(难度一般 扣取代码即可)

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)