26年规模最大的IPO:世界最大芯片,挑战英伟达推理霸主地位 2026年5月14日Cerebras Systems在纳斯达克上市以每股185美元的价格发行3000万股筹集55.5亿美元成为2026年迄今规模最大的IPO。首日股价盘中一度暴涨108%市值突破千亿美元大关。彭博社Bloomberg报道称此次IPO的“需求超出供给超过20倍”导致公司在最终定价时大幅上调了发行价格。这家创立于2015年的芯片公司凭借其革命性的晶圆级引擎Wafer-Scale Engine技术正在挑战英伟达在AI芯片领域的霸主地位。Cerebras的上市历程可谓一波三折。公司2024年9月向美国证券交易委员会SEC提交了S-1注册文件但此后因美国外国投资委员会CFIUS对其阿联酋客户G42的投资审查而被迫撤回申请。直到2025年3月CFIUS审查通过后上市通道才重新打开。Cerebras于2026年4月重新提交了注册文件此时的公司面貌已与2024年大不相同。新的OpenAI合作、AWS伙伴关系以及快速增长的云端推理业务构成了一个更为多元化和引人注目的增长故事。自2022年以来受宏观经济不确定性和高利率环境影响全球科技企业IPO数量大幅萎缩。Cerebras的现象级表现为整个科技IPO市场注入了一剂强心针。市场普遍将Cerebras的上市视为2026年AI相关企业上市潮的序幕。SpaceX、OpenAI、Anthropic、Databricks等AI独角兽均被市场传闻正在筹备上市。在这样一个背景下Cerebras的市场表现将在很大程度上影响后续AI企业IPO的定价策略和投资者热情。Cerebras 创立与发展Cerebras Systems于2015年在美国加利福尼亚州森尼韦尔Sunnyvale创立创始团队由五位核心成员组成安德鲁·费尔德曼Andrew Feldman、加里·劳特巴赫Gary Lauterbach、迈克尔·詹姆斯Michael James、肖恩·李Sean Lie和让-菲利普·弗里克Jean-Philippe Fricker。这五位创始人有着深厚的技术渊源他们此前都在SeaMicro共事。SeaMicro是费尔德曼和劳特巴赫于2007年联合创立的一家专注于节能微服务器的创业公司于2012年被AMD以3.34亿美元收购。SeaMicro的成功证明了创始人团队在芯片架构和数据中心技术领域的深厚积累。Cerebras的创立源于一个大胆而近乎疯狂的技术愿景将整块硅晶圆作为一颗芯片来使用。在半导体行业75年的历史中标准做法是将一块硅晶圆约唱片大小上印刻数百颗相同的芯片然后将它们切割开来分别封装和出售。芯片之所以做得小是因为硅晶圆制造过程中不可避免地会产生微小缺陷芯片面积越大缺陷落在其内部的概率就越高整颗芯片报废的风险就越大。因此行业惯例是将芯片控制在邮票大小左右最大约815平方毫米受限于光刻机掩模版尺寸。Cerebras反其道而行之。创始人团队在2015年就预见到了AI工作负载的本质特征计算不是瓶颈数据搬运才是。在GPU集群中大量时间和能量被消耗在芯片之间的数据传输上而非实际的计算操作。如果能将所有计算单元集中在一块巨大的芯片上让数据永远不需要离开芯片就能从根本上消除这一瓶颈。然而将整块晶圆变成一颗可工作的芯片面临着前所未有的工程挑战。首先晶圆制造中的缺陷问题。任何一颗微小缺陷都可能毁掉整块晶圆芯片。Cerebras通过开发容错架构解决了这一问题利用冗余计算模块绕过制造缺陷其原理类似于超大规模数据中心处理服务器故障的方式。其次是芯片封装和散热问题。一块餐盘大小的芯片功率消耗高达25千瓦如果不采取特殊散热措施芯片会在启动瞬间熔毁。Cerebras发明了专用的水冷系统并解决了硅芯片与主板之间的大面积粘合、供电和数据管道传输等一系列封装工程难题。据Observer杂志报道公司一度每月烧掉800万美元花了2亿美元试图解决封装问题甚至在早期需要发明一台能够同时将40颗螺丝钻入晶圆而不使其破裂的专用机器。Cerebras的早期商业化之路异常艰难。公司在S-1文件中坦言早期阶段AI尚处于萌芽状态原始且未经证实。训练耗时漫长是少数人的“黑艺术”。GPU尚未成为瓶颈。而Cerebras的解决方案找不到市场。直到2022年Cerebras的年收入仅为2500万美元主要来自少数生命科学领域的客户。在当时的硅谷几乎没有多少人看好这家坚持走晶圆级路线的偏执狂公司。然而转折来得迅猛而猛烈。随着ChatGPT在2022年底横空出世大语言模型浪潮席卷全球AI推理Inference迅速成为AI计算中最重要、增长最快的负载类型。而Cerebras的晶圆级架构恰恰在推理场景中展现出压倒性优势推理的本质是逐个生成token每次生成都需要将整个模型的权重从内存搬运到计算单元这是一个本质上串行的过程无法通过增加GPU数量来加速。因此内存带宽成为推理速度的决定性因素而Cerebras的晶圆级芯片提供了远超任何GPU集群的片上内存带宽。这一技术洞察的正确性得到了市场的验证。到了2025年Cerebras的收入飙升至5.1亿美元同比增长76%较2024年的2.9亿美元和2022年的区区2500万美元实现了质的飞跃。更重要的是公司在2025年实现了2.378亿美元的GAAP净利润2024年净亏损4.816亿美元净利率约为47%。VentureBeat的分析进一步指出Cerebras的财务改善趋势在2026年上半年仍在加速。随着OpenAI合同开始贡献收入以及云端推理服务用户基础的持续扩大市场分析师普遍预计Cerebras 2026年的收入将达到8亿美元左右同比增长约57%。在IPO前的私人市场融资中Cerebras累计筹集了超过20亿美元。这一数字在半导体创业公司中极为罕见。G轮2025年9月的领投方Fidelity和Atreides Management是华尔街最具影响力的机构投资者之一。这一轮11亿美元的融资获得了超额认购将公司估值推升至81亿美元。H轮2026年2月的领投方Tiger Global则是全球最激进的增长型科技投资者之一其领投将估值在短短五个月内推升至约230亿美元近乎三倍的估值飞跃。此轮的参与方阵容豪华包括BenchmarkCerebras最大机构股东持有1760万股、Fidelity、Atreides、Alpha Wave、Altimeter、AMD、Coatue和1789 Capital。根据Wikipedia和S-1文件IPO前的主要股东结构为Benchmark1760万股、Foundation Capital1530万股、Eclipse Ventures Fund 11350万股、Alpha Wave1210万股、安德鲁·费尔德曼本人1010万股、肖恩·李530万股、G42350万股。此外OpenAI持有购买3340万股的认股权证warrants但行使条件是OpenAI需按约定购买Cerebras的计算能力。Cerebras发展历程中一个不可回避的话题是其与阿联酋人工智能公司G42的深度关联。在2023年和2024年上半年G42一度占Cerebras硬件销售收入的95%至97%。这种极端的客户集中度在美国国家安全审查日益严格的背景下引发了严重的监管担忧。CFIUS美国外国投资委员会对G42持有Cerebras少数股权一事进行了审查这一审查成为阻碍Cerebras在2024年完成IPO的主要障碍。2025年3月CFIUS正式批准了G42持有其少数投资的请求扫清了上市道路上的最大监管障碍。此后Cerebras积极多元化其客户基础到2025年G42相关收入通过MBZUAI和G42两个实体合计约占年收入的86%虽然仍然偏高但较2024年的近100%已有明显改善。2026年1月Cerebras宣布与OpenAI签署了一份价值超过100亿美元后扩大至超过200亿美元的多年度计算协议覆盖750兆瓦AI推理算力有效期至2028年。这一合作从根本上改变了Cerebras的客户构成引入了一个总部位于美国的蓝筹客户在规模上足以彻底重塑公司的收入结构。世界最大商用芯片Cerebras的核心产品是晶圆级引擎Wafer-Scale EngineWSE系列芯片及其搭载的计算系统。截至目前Cerebras已经推出了三代晶圆级引擎WSE第一代 Cerebras的首款产品首次证明了晶圆级集成的商业可行性。虽然具体参数未完全公开但其技术突破意义在于——在半导体行业75年历史上从未有公司成功将整块晶圆作为一颗可工作的商用芯片推向市场。WSE-2第二代 集成了2.6万亿个晶体管、85万个AI优化计算核心拥有40GB片上SRAM静态随机存取存储器。WSE-2相比第一代在晶体管数量和计算核心数量上都有大幅提升。WSE-3第三代当前旗舰 Cerebras目前的巅峰之作也是目前世界上最大的商用AI芯片其核心参数令人震撼要真正理解Cerebras的技术价值需要深入理解AI推理的计算特征与半导体物理之间的关系。正如Mostly Metrics在一篇S-1深度分析中生动地比喻的想象一个装满会计师的巨大房间每个会计师都能做数学题但每次完成计算后他们必须走到大厅另一端把结果交给另一位会计师才能继续工作。数学计算本身并不困难但他们走得太慢了走路消耗了他们大量的时间和精力。Cerebras的做法是把90万个会计师放在同一个房间里的同一块硅片上这样数据就永远不需要走到任何地方。WSE-3芯片被封装在Cerebras的CS-3计算系统中。CS-3是一个完整的机架式系统包含芯片封装、供电、水冷和数据输入/输出I/O等全部基础设施。单台CS-3系统内含一颗WSE-3芯片可实现125 PFLOPS千万亿次浮点运算每秒的AI计算性能。更重要的是CS-3系统支持线性扩展。通过将多达2048台CS-3节点组成集群Cerebras声称可实现高达256 EFLOPS百亿亿次浮点运算每秒的聚合AI计算性能。这种可扩展性使Cerebras能够满足从中小型研究实验室到超大规模云计算服务商的各类需求。Cerebras声称在多项基准测试中单台CS-3系统的性能是英伟达旗舰DGX B200系统的21倍而成本和功耗仅为后者的三分之一。在开源模型推理任务中Cerebras的推理速度据称是最快GPU方案的15倍以上。独立基准测试机构Artificial Analysis的多项测试一致将Cerebras评为全球最快的AI推理服务商。在一项碳捕获模型的训练任务中Cerebras实现了较英伟达H100高达210倍的加速。2024年以来Cerebras的业务模式从纯粹的硬件销售转向云端推理服务平台。Cerebras的云端推理API服务允许开发者和企业直接通过互联网访问其算力无需购买昂贵的硬件设备。2025年Cerebras的云端推理服务收入达到1.52亿美元增长势头强劲。公司首席营销官朱莉·蔡Julie Choi在IPO当天接受VentureBeat采访时表示公司计划将IPO募集的新资本用于用Cerebras系统填满更多数据中心为全球最快的推理提供动力。此外Cerebras的云端推理服务也已上架AWS Marketplace亚马逊云服务市场AWS客户可以直接在亚马逊的云平台上采购Cerebras的推理服务。美国AI芯片市场格局英伟达毫无疑问的市场领导者在训练和推理两个领域均占据主导地位。其核心竞争力在于CUDA软件生态的深度和广度以及持续快速的产品迭代能力Hopper、Blackwell、Rubin、Rubin Ultra的产品路线图清晰且执行有力。AMD的MI300X已经在部分AI工作负载中展现出与英伟达H100相媲美的性能且价格通常更有竞争力。值得注意的是AMD同时是Cerebras的H轮投资者和英伟达的竞争对手这一微妙的关系反映了AMD对多元化AI计算生态的战略押注。AMD的ROCm软件平台虽然在成熟度上不及CUDA但在开源社区的支持下正在快速进步。Groq则另一家走专用推理芯片路线的创业公司采用LPULanguage Processing Unit架构专注于低延迟推理。与Cerebras类似Groq也在推理速度上宣称大幅超越GPU方案。两家公司在推理市场的直接竞争不可避免。谷歌自研的AI加速器芯片TPU主要用于谷歌内部的AI服务如Gemini、Google Search的AI功能等但通过Google Cloud对外提供。英特尔Gaudi系列AI加速器是英特尔在AI芯片市场的主要产品线但在性能和市场渗透方面一直未能对英伟达构成实质性威胁。不过英特尔在先进封装和制造工艺方面的能力仍然是不可忽视的潜在竞争优势。在这个竞争格局中Cerebras是唯一一家成功将晶圆级集成商业化的公司在推理延迟和带宽方面拥有独特的结构性优势。如果晶圆级架构被证明是AI计算的未来方向之一那么Cerebras或成为英伟达有力的市场挑战者。