【导语OpenAI 和博通宣布推出专为数据中心大语言模型推理设计的 Jalapeño 芯片这是长期项目的第一代产品后续会不断改进早期测试显示其每瓦性能或大幅优于当前水平。】OpenAI 与博通携手打造新芯片ChatGPT 和 Codex 背后的公司 OpenAI 与老牌芯片供应商博通合作推出了名为 Jalapeño 的新型芯片。该芯片专为数据中心的大语言模型推理而设计将部署在大型数据中心。基于交流见解与未来规划的设计博通表示这款专用集成电路ASIC是专门为大语言模型推理全新设计的。其设计基于博通与 OpenAI 研究人员交流所获得的“详细见解”还参考了 OpenAI 未来模型和产品的发展规划。从设计到生产该芯片耗时九个月。性能优势待验证与现有数据中心推理系统目前使用的芯片相比Jalapeño 能更好地满足当前大语言模型的需求。OpenAI 称“早期测试显示Jalapeño 的每瓦性能将大幅优于当前最先进的水平”不过性能测试尚未完成“详细的技术报告将在未来几个月发布”。编辑观点OpenAI 与博通合作推出的 Jalapeño 芯片前景可期若能实现性能优势将为大语言模型推理带来新突破但最终效果仍需等待详细技术报告。
OpenAI 与博通联手推出 Jalapeño 芯片,每瓦性能或大幅优于现有水平
【导语OpenAI 和博通宣布推出专为数据中心大语言模型推理设计的 Jalapeño 芯片这是长期项目的第一代产品后续会不断改进早期测试显示其每瓦性能或大幅优于当前水平。】OpenAI 与博通携手打造新芯片ChatGPT 和 Codex 背后的公司 OpenAI 与老牌芯片供应商博通合作推出了名为 Jalapeño 的新型芯片。该芯片专为数据中心的大语言模型推理而设计将部署在大型数据中心。基于交流见解与未来规划的设计博通表示这款专用集成电路ASIC是专门为大语言模型推理全新设计的。其设计基于博通与 OpenAI 研究人员交流所获得的“详细见解”还参考了 OpenAI 未来模型和产品的发展规划。从设计到生产该芯片耗时九个月。性能优势待验证与现有数据中心推理系统目前使用的芯片相比Jalapeño 能更好地满足当前大语言模型的需求。OpenAI 称“早期测试显示Jalapeño 的每瓦性能将大幅优于当前最先进的水平”不过性能测试尚未完成“详细的技术报告将在未来几个月发布”。编辑观点OpenAI 与博通合作推出的 Jalapeño 芯片前景可期若能实现性能优势将为大语言模型推理带来新突破但最终效果仍需等待详细技术报告。
相关文章
Windows 下 Claude Code 升级指南
文档版本:v1.0 编写日期:2026/06/25 适用环境:Windows 10 / 11 npm 全局安装的 Claude Code 适用版本:2.1.183 → 2.1.191(通用,可推广到后续小版本升级) 目录 背景升级前的诊断标准升级流程&…
基于pytest的自动化压力测试与异常注入框架实战
1. 项目概述与核心价值 最近在团队里搞了一次压力测试框架的升级,核心目标是把传统的、手动的、零散的压力验证,变成一个自动化、可重复、能模拟各种“幺蛾子”场景的工程化体系。我们选用了 pytest 作为核心测试框架,并在此基础上深度集成…
中关村人工智能会议敲响警钟:中美搁置竞争,携手应对AI风险刻不容缓!
中关村AI会议精彩纷呈就在一周多前,有人参加了在北京繁华的高科技区——中关村举办的一场大型人工智能会议。会议内容丰富,涵盖从递归自我改进(即模型可以自行调整代码并无限发展的理念)到人形机器人等各个方面。传奇人物齐聚会上…
基于STM32的数字卦占卦工具设计与实现
1. 数字卦占卦工具设计背景与原理作为一名对传统文化感兴趣的硬件开发者,我一直想制作一款既实用又有美感的数字卦占卦工具。传统数字卦方法存在明显的随机性问题——经常占卦的人会逐渐记住某些数字对应的卦象,导致结果不够客观。这正是我开发这款工具的…
Linux 内核网络栈调优:从 TCP 拥塞控制到连接池瓶颈的深度优化
Linux 内核网络栈调优:从 TCP 拥塞控制到连接池瓶颈的深度优化一、高并发下的网络栈瓶颈:当带宽充足但吞吐量上不去 生产环境中经常遇到这样的场景:服务器带宽 10Gbps,CPU 和内存充裕,但实际吞吐量只有 2-3Gbps。应用层…
基于DCT变换的图像加密原理与Matlab实现详解
1. 项目概述:当图像需要“上锁”时在数字信息泛滥的今天,图像作为信息的重要载体,其安全传输与存储变得至关重要。无论是个人隐私照片、商业设计图纸,还是医疗影像资料,一旦在传输过程中被截获或存储时被非法访问&…
终极KMS智能激活方案:5分钟永久解决Windows和Office激活难题
终极KMS智能激活方案:5分钟永久解决Windows和Office激活难题 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows系统频繁弹出激活提示而烦恼吗?Office文档突然…
10分钟AI语音克隆与实时变声:Retrieval-based-Voice-Conversion-WebUI完整指南
10分钟AI语音克隆与实时变声:Retrieval-based-Voice-Conversion-WebUI完整指南 【免费下载链接】Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data < 10 mins! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrie…
Tomcat中X-Frame-Options配置实战:防御点击劫持的四种方法与最佳实践
1. 项目概述:为什么X-Frame-Options是Web安全的“防盗门”?最近在排查一个老项目的安全审计报告时,又被提到了“点击劫持”风险,矛头直指缺失的X-Frame-Options响应头。这已经不是第一次了,很多开发团队,尤…
千问AI眼镜:阿里AI战略急先锋,能否在激烈竞争中突围?
千问眼镜:销量第一背后的挑战不久前,不少第三方统计机构给千问背书,甚至给出全国销量第一的统计结果。这个第一的含金量有多高?暂且先打个问号。但这些榜单至少说明,千问眼镜延续了阿里AI战略整体偏激进的风格…
Tomcat中X-Frame-Options配置实战:防御点击劫持的四种方法与最佳实践
1. 项目概述:为什么X-Frame-Options是Web安全的“防盗门”?最近在排查一个老项目的安全审计报告时,又被提到了“点击劫持”风险,矛头直指缺失的X-Frame-Options响应头。这已经不是第一次了,很多开发团队,尤…
10分钟AI语音克隆与实时变声:Retrieval-based-Voice-Conversion-WebUI完整指南
10分钟AI语音克隆与实时变声:Retrieval-based-Voice-Conversion-WebUI完整指南 【免费下载链接】Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data < 10 mins! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrie…
Google AI Studio 300美元额度的真相与实战指南
1. 这300美金不是“送钱”,而是Google埋下的第一道技术门槛 你看到标题里那个醒目的“$300美金”时,第一反应可能是:又一个免费额度?领完就完事?我亲手试过——这300美金根本不是红包,而是一张入场券&…
PDF对比终极指南:用diff-pdf轻松识别文档差异的完整教程
PDF对比终极指南:用diff-pdf轻松识别文档差异的完整教程 【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗?diff-pdf这款开…
嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用
1. 嵌入式GUI控件:从原理到实战的深度解析在嵌入式系统开发中,图形用户界面(GUI)的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台,嵌入式设备的GUI需要在有限的CPU性能、内存空间…
Zotero Duplicates Merger:5步彻底清理文献库重复条目
Zotero Duplicates Merger:5步彻底清理文献库重复条目 【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…
利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码
✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室🍊个人信条:格物致知,完整Matlab代码及仿真咨询…
为什么你的Gemini邮件CTE低于行业均值2.8倍?:从Prompt架构到发送时序的深度归因
更多请点击: https://intelliparadigm.com 第一章:为什么你的Gemini邮件CTE低于行业均值2.8倍?:从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率(CTE)显著偏低,根本原因常被误判为…