Transformer 作者与辛顿门徒联手:Cohere 开源旗舰 Command A+,企业 AI 降本增效新突破 Transformer作者联手辛顿门徒Cohere开源旗舰模型Command A5月20日《Attention Is All You Need》论文的共同作者Aidan Gomez在X上宣布推出首个完全开源的Apache 2.0许可的模型Cohere Command A。Gomez是前谷歌研究员也是Cohere的联合创始人兼CEO。Command A是Command A家族的最后一个模型也是Cohere的第一个MoE混合专家模型拥有218B总参数25B激活参数能一次性整合视觉输入、推理、翻译和AI智能体能力。MoE架构与量化技术省算力又提性能Command A采用MoE架构将问题路由给最擅长处理的“专家”神经网络其余部分休眠运行时算力和能耗接近小模型。此外Cohere还叠加了量化技术提供BF16、FP8和W4A4三种版本W4A4是技术核心。Cohere称W4A4量化方案接近无损W4A4版本在低并发下每秒达375个token首token延迟仅113毫秒。Apache 2.0许可真正的开源模型在AI圈“开源”常有名无实很多公司虽开放权重但商用受限。Cohere此前的Command R、Command R采用CC - BY - NC 4.0许可严禁商用。而Command A采用Apache 2.0许可任何人都可使用、修改、分发并商业化无需授权费和竞业条款这一转变由联合创始人Nick Frosst力主推动。原生引用生成提升模型可信度一个模型要进入金融、医疗、法律等生产环境可信是关键。Command A做了原生引用生成设计检索信息时会生成“grounding spans溯源标记”将事实声明链接到引用文档或数据库记录降低幻觉风险对受监管行业尤为重要。智能体与多模态能力应用场景广泛Command A支持标准chat template下的对话式工具调用可对接内部API、搜索引擎或SQL数据库。它还是全多模态的能在128K输入上下文里处理文本和图像适合分析扫描发票、图表和技术手册。据Cohere数据在多项测试中Command A表现提升显著但在深度智能体编码和综合智能广度上仍落后于部分中国头部开源模型。降本增效重写企业AI成本账Command A降低了企业使用AI的成本。一是部署门槛降低过去千亿级模型需GPU集群现在最低1张B200或2张H100即可二是推理开销降低W4A4版本输出速度较前代最高提升63%延迟降低17%三是多语言成本降低新分词器让非欧洲语言更省token。近期Cohere还宣布与德国AI公司Aleph Alpha合并开源大模型竞争进入下半场比拼谁能让企业把模型搬进自家机房。