小米狂撒Token！最高降幅99%，全面对标DeepSeek

发布时间：2026/6/11 16:49:09

5月22日DeepSeek宣布V4-Pro API永久降价五天后小米MiMo跟进最高降幅99%Pro版三项核心价格与DeepSeek完全一致。国产大模型API价格战正式杀入成本线。一个月三连降DeepSeek V4系列4月25日上线V4-Pro首发定价为输入缓存命中0.1元/百万tokens输入缓存未命中12元/百万tokens输出24元/百万tokens。第二天就动了。4月26日20:15DeepSeek宣布全系API输入缓存命中价降至首发价的1/10V4-Pro同时叠加2.5折限时优惠缓存命中价直接压到0.025元/百万tokens。限时优惠原定5月5日结束后来延至5月31日。5月22日晚间DeepSeek正式宣布2.5折优惠不再限时永久生效。5月31日活动结束后V4-Pro定价调整为原价的1/4。降价的底气来自技术迭代。V4-Pro总参数1.6万亿是全球最大的开源MoE混合专家模型。百万级调用场景下单次推理算力消耗降至前代的27%缓存显存占用仅为原来的1/10。DeepSeek去年公开的推理成本Token都以DeepSeek-R1的价格计费利润率高达545%。另一重底气来自资本。降价公告同一天彭博社等媒体报道DeepSeek正推进约700亿元人民币融资潜在投前估值约450亿美元。创始人梁文锋向投资者强调的仍是开源模型和AGI通用人工智能目标而非短期商业化。他个人还将出资约200亿元参与本轮融资。V4-Pro永久降价更像长期生态策略不是阶段性促销。五天后小米对齐5月27日零时小米MiMo官方公告MiMo-V2.5系列API永久降价最高降幅99%不再区分上下文窗口长度。雷军在微博转发了这条消息强调最高降幅达到99%不再区分上下文窗口。99%的降幅足够醒目。降价后的三个数字与五天前DeepSeek确定的V4-Pro长期价格完全一致。小米还取消了上下文长度分档。此前MiMo-V2系列按256K以内和256K至1M分档计价长窗口成本明显更高。V2.5系列降价后不再区分等于直接降低了长上下文任务的使用门槛。Token Plan计费体系同步调整同等价格下用量提升至5至8倍所有仍在有效期内的用户额度全量重置。100T Token创作者激励计划已于5月26日提前发放完毕永久降价和额度重置是在免费Token红利结束后继续承接开发者生态。技术层面小米称基于SGLang HiCache完整支持SWA将KV Cache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量降至优化前的近1/7可缓存token数量提升至近5倍并通过专家并行、输入长度分桶提升集群吞吐。正是这些后台工程优化决定了厂商是否有能力长期维持低价。谁更便宜已经不够了对于代码助手、企业知识库、客服系统、Agent智能体工作流来说大量调用包含重复上下文系统提示词、工具说明、历史轨迹、代码仓库背景会在多轮任务中反复出现。过去长上下文和多步Agent难以大规模部署持续调用成本过高是主因。缓存命中价压到0.025元/百万tokens真正被重估的是复杂任务连续运行的成本。放到全球价格体系中差距更加明显。OpenAI的GPT-5.5 Pro API定价为输入30美元/百万tokens、输出180美元/百万tokens。DeepSeek V4-Pro和MiMo-V2.5-Pro调价后仅以缓存未命中输入3元、输出6元计算价格已低出不止一个数量级。行业走势也在分化。5月初字节旗下豆包App推出三档订阅标准版每月68元、加强版200元、专业版500元。智谱今年已三次上调API价格4月8日发布GLM-5.1时再涨10%。阿里云5月15日起上调百炼平台模型服务价格腾讯云同月宣布AI算力相关产品涨价5%。一周之内大模型行业走出了三种方向豆包开始收费云厂商集体涨价DeepSeek永久降价小米对齐跟进。大模型API价格战已经不只是模型参数和榜单能力的竞争而是延伸到推理框架、缓存系统和集群资源调度能力的竞争。能否在高并发、长上下文和多轮调用下持续压低单token服务成本正在成为厂商基础设施能力的一部分。DeepSeek先把限时优惠变成长期价格小米MiMo随后将Pro档价格直接对齐。两家公司共同释放的信号是国产大模型API正在从能力溢价阶段进入成本约束阶段。后续压力将传导给更多模型厂商。同等能力区间的模型已经可以把缓存命中输入压到0.025元/百万tokens价格更高的模型需要向开发者回答贵出来的部分究竟来自更强能力、更高稳定性、还是仅仅来自过去的定价惯性。

魔力宝贝回忆手游官网下载：魔力宝贝回忆最新官方下载渠道

魔力宝贝回忆手游官网下载：魔力宝贝回忆最新官方下载渠道《魔力宝贝回忆》又名《魔力宝贝合成版》《魔力宝贝怀旧版》《魔力宝贝十宠战版》《魔力宝贝正版回合》，由安徽游昕联合忆往游戏运营、SE 正版授权的经典回合制 MMORPG 手游。1:1 复刻法兰城、芙蕾…

2026/6/11 19:02:09 阅读更多

英雄联盟智能助手：如何用本地化工具提升你的游戏体验与胜率

英雄联盟智能助手：如何用本地化工具提升你的游戏体验与胜率【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 你是否曾因为网络延迟导…

2026/6/7 20:38:55 阅读更多

如何在c加加项目中集成taotoken的openai兼容api接口

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度如何在 C 项目中集成 Taotoken 的 OpenAI 兼容 API 接口基础教程类，面向使用 C 进行开发的工程师，介绍如何…

2026/6/10 15:14:27 阅读更多

端侧 AI 安全推理：TEE 与模型加密的协同防护机制

端侧 AI 安全推理：TEE 与模型加密的协同防护机制一、端侧推理的信任缺失：模型资产与推理数据的双重泄露风险端侧 AI 推理面临两类安全威胁：模型资产泄露和推理数据泄露。模型资产泄露是指攻击者从设备中提取训练好的模型参数，导致…

2026/6/11 19:04:05 阅读更多

3分钟零代码搭建专业数据可视化大屏：DataRoom完全指南

3分钟零代码搭建专业数据可视化大屏：DataRoom完全指南【免费下载链接】DataRoom DataRoom是一款基于SpringBoot3.x、JDK17、Vue3.x、Vite8.x、Element-plus、Echarts6.x等技术栈的大屏设计器，具备大屏、仪表板设计、预览能力，支持MySQL、Pos…

2026/6/11 19:04:05 阅读更多

MPC8323E处理器接口电气特性与PCB布局实战指南

1. MPC8323E处理器接口电气特性深度解析在嵌入式硬件设计领域，尤其是涉及网络通信和复杂控制的应用中，处理器的接口电气特性是决定系统成败的基石。飞思卡尔（现为NXP）的MPC8323E PowerQUICC II Pro处理器，作为一款高度…

2026/6/11 19:03:24 阅读更多

Linux终端常用命令

一、基本语法 1. 命令的基本结构 Linux 命令通常长这样： 命令 [选项] [参数]例如： ls -l /home/nvidia意思是： ls 命令：列出文件 -l 选项：用详细格式显示 /home/nvidia 参数：要查看的目录再比…

2026/6/11 19:03:24 阅读更多

写字楼外墙灯光改造全指南：预算、工期与施工注意事项

根据中国照明学会2026年发布的《城市商业建筑照明升级调研报告》显示，国内已有62%的一线城市商务楼完成了外墙照明改造，其中89%的项目实现了楼宇辨识度提升15%以上、夜间商业引流效果增长23%的正向收益。但不少业主在改造前都会遇到预算模糊、工期不确定…

2026/6/11 19:03:04 阅读更多

GitHub Desktop中文汉化终极解决方案：三分钟解锁全中文Git操作体验

GitHub Desktop中文汉化终极解决方案：三分钟解锁全中文Git操作体验【免费下载链接】GitHubDesktop2Chinese GithubDesktop语言本地化(汉化)工具【GitHub桌面客户端中文汉化】项目地址: https://gitcode.com/gh_mirrors/gi/GitHubDesktop2Chinese 还在为Gi…

2026/6/11 19:03:04 阅读更多

LLM 多轮对话状态管理：从无状态 API 到有状态会话

LLM 多轮对话状态管理：从无状态 API 到有状态会话一、大模型 API 的无状态困境：上下文窗口的有限性与会话连续性大模型的 Chat API 本质上是无状态的——每次请求都需要发送完整的对话历史。这种设计简化了服务端实现，但给后端架构带来了两个…

2026/6/11 1:00:57 阅读更多

Spring Boot 3 与 GraalVM 原生镜像：从 JIT 到 AOT 的启动革命

Spring Boot 3 与 GraalVM 原生镜像：从 JIT 到 AOT 的启动革命一、JVM 冷启动的性能困境：云原生环境下的启动延迟 Java 应用在云原生环境中面临的核心挑战是冷启动延迟。一个典型的 Spring Boot 2 应用，启动时间约 3-8 秒，内存占…

2026/6/11 1:01:58 阅读更多

Go 错误处理与错误链：从哨兵错误到自定义错误类型的工程实践

Go 错误处理与错误链：从哨兵错误到自定义错误类型的工程实践一、Go 错误处理的工程困境：哨兵值与信息丢失 Go 的错误处理采用显式返回值模式，if err ! nil 是每个 Go 开发者最熟悉的代码片段。然而，当项目规模增长后，简…

2026/6/11 1:01:58 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/11 0:58:15 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/11 0:58:13 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/11 0:58:10 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/11 9:57:14 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/11 9:57:16 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…