AI Weekly 6.8-6.14 本周 AI 快讯 | 1 分钟速览01月之暗面开源 Kimi K2.7 Code万亿参数编程模型预告 6 倍速版MoE 架构 32B 激活参数 384 个专家256K 上下文窗口编程思考 token 消耗比Kimi K2.6减少 30%权重上线 Hugging Face 和 ModelScopeModified MIT 协议6 倍速高速版定档下周一。02小米 MiMo V2.5-Pro-UltraSpeed 万亿参数破 1000 tokens/sMiMo Code 同周开源FP4 量化 DFlash 推测解码单节点八卡实现万亿参数千 token 输出速度实测峰值接近 1200 tokens/sAPI 试用至 6 月 23 日MiMo Code 基于 OpenCode 开源采用 MIT 协议界面全汉化内置限时免费MiMo-V2.5多模态模型。03豆包上线「任务模式」AI 可自主规划定时任务并生成交付物支持定时执行、代码运行和文件生成可自动产出 PPT、数据分析报告和定期汇总3.45 亿月活的豆包首次支持定时自动执行任务同步将「思考模式」升级为侧重深度推理的「专家模式」。04智谱 GLM-5.2 全量开放1M 上下文旗舰模型下周开源面向全量 GLM Coding Plan 用户开放覆盖 Lite/Pro/Max/团队版支持 1M 上下文窗口和 High/Max 两档思考深度API 下周上线模型下周正式开源发布时间选在 5:21 PM呼应Claude Fable 5被叫停指令的下达时刻。05Anthropic 发布 Claude Fable 5 三天即遭出口管制令全球下架SWE-bench Pro 80.3%定价上代Claude Opus 4.8的 2 倍6 月 22 日前免费出口管制指令以国家安全为由暂停所有用户访问Claude Fable 5和Claude Mythos 5Anthropic 已执行并重置全部用户限额Anthropic 称越狱发现在GPT-5.5等模型中同样存在公开表示不同意。06OpenAI 提交 S-1据报道考虑大幅降价迎战 Anthropic向 SEC 递交保密版 S-1 注册草案高盛、摩根士丹利和摩根大通联合领衔目标估值约 1 万亿美元年化收入已达 250 亿美元据报道正在考虑大幅削减 token 定价预判 Anthropic 也将跟进。07OpenAI 收购 Ona 强化 Codex 云端能力同周上线额度银行和推荐计划Ona 前身是 Gitpod为 Codex 提供安全持久化云环境Codex 周活用户超 500 万较年初增长 400%额度重置可存起来自主使用邀请好友双方各得一次重置活动持续至 6 月 24 日。08谷歌 AI Plus 降到 4.99 美元Gemini 3.5 Live Translate 支持 70 语言实时互译月费从 7.99 美元降到 4.99 美元存储从 200GB 翻倍到 400GB仅为 ChatGPT Plus20 美元的四分之一Gemini 3.5 Live Translate可自动识别 70 多种语言并保留说话者语调和语速谷歌翻译 App 直接可用同周开源DiffusionGemma文本扩散模型推理速度比自回归模型提升 4 倍。09苹果 WWDC 用谷歌 Gemini 重做 Siri独立 App 1.2 万亿参数Siri 诞生 15 年来最大一次重写搭载 1.2 万亿参数谷歌 Gemini 定制模型MoE 架构新 Siri 作为独立 App 登陆 iOS 27支持多模态输入、多步指令和持久对话历史三层路由架构按复杂度分发到设备端、Private Cloud Compute 和 Google Cloud苹果为此每年向谷歌支付约 10 亿美元。10SpaceX 完成史上最大 IPO首日收涨 19%6 月 12 日纳斯达克上市代码 SPCX发行价 135 美元首日收盘 161 美元估值约 1.77 万亿美元募资约 750 亿美元刷新全球 IPO 纪录。01月之暗面开源「Kimi K2.7 Code」万亿参数编程模型预告 6 倍速版32B 激活参数384 个专家256K token 上下文。月之暗面 6 月 12 日发布并开源Kimi K2.7 Code一款专为长程编程任务设计的万亿参数 MoE 模型。和上代Kimi K2.6相比完成相同编程任务消耗的思考 token 减少 30%。模型权重已上线 Hugging Face 和 ModelScope采用 Modified MIT 协议。同步预告的 6 倍速高速版定档下周一。Kimi K2.7 Code目前可通过 Moonshot API、vLLM 和 Docker Model Runner 部署使用。Kimi K2.7 Code是月之暗面不到一年内发布的第五款 Kimi K2 系列模型从 2025 年 7 月Kimi K2上线到现在平均两个多月发布一个大版本。开源权重加上编程专项优化方便开发团队在自有环境部署编程 Agent。02小米「MiMo V2.5-Pro-UltraSpeed」万亿参数破 1000 tokens/sMiMo Code 同周开源雷军 6 月 9 日发文介绍MiMo-V2.5-Pro-UltraSpeed是业内首次在万亿参数模型上突破 1000 tokens/s 输出速度。在标准八卡 GPU 节点上通过 FP4 量化和 DFlash 推测解码实现实测峰值接近 1200 tokens/s不需要定制芯片。API 试用期为 6 月 9 日至 23 日定价是标准版MiMo-V2.5-Pro的 3 倍换来约 10 倍的速度提升。两天后的 6 月 11 日小米同步发布并开源 MiMo Code V0.1.0。基于开源项目 OpenCode 二次开发采用 MIT 协议界面全汉化内置限时免费的MiMo-V2.5多模态模型同时支持接入 DeepSeek、Kimi 和 GLM 等主流模型。MiMo Code 内置持久记忆系统通过项目记忆和对话检查点机制维持长对话中的上下文连贯性。03豆包上线「任务模式」AI 可自主规划定时任务并生成交付物豆包 App 6 月 12 日新增「任务模式」。用户可以设定定时执行计划AI 自主规划执行步骤支持代码运行和文件生成能直接产出 PPT、数据分析报告和定期汇总。豆包月活用户 3.45 亿「任务模式」是这个体量的产品首次支持后台自动执行任务。同步上线的「专家模式」由此前的「思考模式」升级而来调用豆包 2.0 Pro模型侧重深度推理支持百万级长文档分析适合医学、法律、金融等高复杂度场景。加上此前宣布的四档付费订阅68-500 元/月预计 6 月下旬上线豆包一个月内接连推出收费方案和任务执行能力。04智谱「GLM-5.2」全量开放1M 上下文旗舰模型下周开源「前沿智能不应只属于少数人也不应被少数规则随时收回。」智谱 6 月 12 日晚发布公告宣布GLM-5.2面向 GLM Coding Plan 全量用户开放覆盖 Lite、Pro、Max 和团队版。GLM-5.2是智谱迄今能力最强的旗舰模型支持 1M token 上下文窗口提供 High 和 Max 两档思考深度编程任务推荐使用 Max 档。API 将于下周上线模型下周正式开源采用 MIT 协议。发布时间定在当晚 5:21。智谱在公告中开篇写道「在一些前沿模型突然变得不可用的时刻我们选择相信另一条路」没有点名但指向明确。公众号评论区涌入上百条留言「国模崛起」「终于等到 1M 上下文了」是最高频的反馈。05「Claude Fable 5」上线三天遭出口管制令全球下架上线三天全球下架。Anthropic 6 月 9 日发布Claude Fable 5SWE-bench Pro 80.3%比Claude Opus 4.8高 11 个百分点FrontierCode Diamond 29.3% 是上代的 2 倍以上。定价输入 10 美元、输出 50 美元每百万 token同样是上代的 2 倍6 月 22 日前付费用户可免费使用。发布后争议接连不断。安全研究者发现Claude Fable 5在触发高风险分类器时会静默降级到Claude Opus 4.8处理用户完全不知情社区批评 Anthropic 在「秘密降智」Anthropic 承认「作出了错误权衡」并道歉。与此同时有红队研究人员声称绕过了模型的安全防线相关技术报告被提交给监管部门。6 月 12 日Anthropic 收到出口管制指令以国家安全为由要求暂停所有用户对Claude Fable 5和Claude Mythos 5的访问包括 Anthropic 内部的外籍员工。Anthropic 已执行并重置了所有用户的 5 小时和周度使用限额作为补偿次日的 Build Day 活动改用Claude Opus 4.8其他 Claude 模型不受影响。Anthropic 在声明中表示不同意这一决定称已审核相关报告认为所展示的能力在GPT-5.5等公开模型中同样存在。Anthropic 认为以发现单一场景的越狱为标准下架商业模型将导致整个行业的前沿模型部署停滞。06OpenAI 提交「S-1」据报道考虑大幅降价迎战 Anthropic6 月 9 日OpenAI 在官方博客宣布已向 SEC 递交保密版 S-1 注册草案。高盛、摩根士丹利和摩根大通联合领衔承销目标估值约 1 万亿美元上市时间窗口预计在 2026 年秋季。此前一周 Anthropic 已提交了自己的 S-1两家头部 AI 公司前后脚启动 IPO 进程。据报道OpenAI 同步在考虑大幅削减 token 定价预判 Anthropic 也将跟进降价。讨论仍处于早期阶段尚未做出最终决定。OpenAI 年化收入已达 250 亿美元两家公司几乎同时启动 IPO 进程定价竞争可能在上市前进一步升级。07OpenAI 收购「Ona」强化 Codex同周上线额度银行和推荐计划Ona 的前身是开发者熟悉的 Gitpod。6 月 11 日OpenAI 宣布收购 Ona将其安全持久化云环境技术整合进 Codex。收购完成后 Ona 团队将并入 Codex 团队交易金额未披露。Codex 目前周活用户超过 500 万较年初增长 400%随着任务周期从分钟级延长到数小时甚至数天持久化的云端执行环境变得越来越关键。同一天OpenAI 上线了 Codex 的「额度银行」功能。额度重置不再按固定时间自动触发用户可以存起来在需要时手动使用。Go、Plus、Pro 和 Business 用户各获得一次免费重置作为起始额度。6 月 11 日至 24 日期间Plus 和 Pro 用户还可以邀请最多 3 位好友试用 Codex好友发出第一条消息后双方各得一次额度重置。08谷歌「AI Plus」降到 4.99 美元Live Translate 支持 70 语言实时互译谷歌 Gemini AI 订阅产品负责人 Vikas Kansal 6 月 8 日宣布AI Plus 套餐月费从 7.99 美元降到 4.99 美元存储空间从 200GB 翻倍到 400GB。现有订阅用户无需操作存储扩容几天内自动生效降价在下一个账单周期开始执行。4.99 美元的月费仅为 ChatGPT Plus20 美元的四分之一。同一周谷歌发布Gemini 3.5 Live Translate实时语音互译模型可自动识别 70 多种语言翻译时保留说话者的语调、语速和音高谷歌翻译 App 直接可用。6 月 11 日还开源了DiffusionGemma文本扩散模型采用非自回归架构本地推理速度比标准自回归模型提升 4 倍权重已上线。09苹果 WWDC 用谷歌 Gemini 重做「Siri」独立 App 1.2 万亿参数Siri 诞生 15 年来最大的一次重写在 WWDC 2026 上正式亮相。苹果与谷歌合作搭载一款 1.2 万亿参数的定制 Gemini 模型重建 Siri 的底层能力MoE 架构每次请求只激活一部分专家子网络以控制延迟。新 Siri 作为独立 App 登陆 iOS 27、iPadOS 27 和 macOS 27支持多模态输入、多步指令和持久对话历史对话记录通过 iCloud 同步。隐私方面苹果设计了三层路由架构。简单任务留在设备端用苹果自研模型处理中等复杂度请求交给 Apple Private Cloud Compute 服务器最重的推理任务路由到 Google Cloud 的英伟达 Blackwell B200 GPU 集群。苹果为此每年向谷歌支付约 10 亿美元。15 年来 Siri 一直靠苹果自有技术驱动这是首次在核心产品中引入外部 AI 大模型。10SpaceX 完成史上最大「IPO」首日收涨 19%发行价 135 美元首日收盘 161 美元涨 19%盘中最高触及 176.52 美元。6 月 12 日SpaceX 以代码 SPCX 在纳斯达克上市通过发行约 5.56 亿股新股募资约 750 亿美元投后估值约 1.77 万亿美元刷新全球 IPO 纪录。上期周刊预告了这次 IPO 的发行价和估值如今数字全部兑现。SpaceX 同时运营火箭发射、星链和 xAI 三项业务其中 xAI 已作为旗下部门运营。加上 Anthropic 和 OpenAI 接连提交 S-12026 年下半年 AI 行业将迎来一波密集上市潮。