全局概览：两条赛道，一场博弈

发布时间：2026/6/25 13:17:08

按量计费API以 token 为单位付费适合开发者成本透明订阅制Consumer月付/年付固定费用解锁配额适合个人和非技术用户2026 年最显著的趋势国产模型在 token 使用量上已全面超越美国。据 OpenRouter 数据2026 年 3 月 30 日至 4 月 5 日一周内中国模型处理12.96 万亿 tokens美国模型仅3.03 万亿 tokens。全球 token 消耗量前六名全部来自中国。二、全球 Token 使用量排行榜数据来源OpenRouter Rankings · OpenRouter 2025 State of AI排名模型厂商周 Token 量估算主要优势1MiMo-V2.5-Pro小米~4.79T1T 参数 MoE1M 上下文2Kimi K2.6Moonshot AI~1.4T编码榜第一256K 上下文3DeepSeek-V4-FlashDeepSeek高极低成本1M 上下文4Qwen 系列阿里巴巴高多尺寸覆盖开源生态5GLM-5智谱 Z.AI中高国内首个上市大模型公司旗舰6Claude Sonnet 4.6Anthropic中SWE-bench 标杆综合能力领先7Gemini 3.1 FlashGoogle中速度快价格低多模态8GPT-5.5OpenAI中生态最广品牌溢价高9MiniMax-M2.5MiniMax中音视频多模态领先10Grok 4xAI低中实时 X 数据推理强关键数据时间中国模型美国模型全球总量2025-05首次超越4.12 万亿2.94 万亿—2026-03-30 ~ 04-0512.96 万亿3.03 万亿27 万亿中国模型在 OpenRouter 平台占比从 2025 年初 2% 升至 2026 年 Q245%。DeepSeek 开源份额从 ~80% 降至 ~40%被 Qwen、MiMo 分流。三、国内 TOP 5 大模型套餐3.1 DeepSeek官网chat.deepseek.com ·API 文档api-docs.deepseek.com ·主体深度求索杭州DeepSeek 以极低 API 价格和顶级推理能力著称颠覆美国主导的定价体系。用户端套餐价格说明免费版¥0全部功能含 DeepSeek-V4-Flash 和深度思考订阅制无官方不提供消费者月付套餐差异化策略超低 API 价格服务开发者消费端完全免费获客。API 计费/1M tokens模型输入缓存命中输出上下文DeepSeek-V4-Flash$0.14$0.0028$0.281MDeepSeek-V4-Pro折扣 75%$0.435$0.003625$0.871MDeepSeek-V4-Pro原价~$1.74—~$3.481MDeepSeek-V3旧~$0.20——128K75% 折扣有效期至 2026-05-05 15:59 UTC来源The Next Web优点免费版功能完整 · API 价格全球最低之一比 GPT-5.5 便宜 35-100x· 开源可本地部署缺点无消费者订阅套餐 · 高峰期偶发不稳定 · 无多模态 · 实时信息有限3.2 KimiMoonshot AI官网kimi.moonshot.cn国内/ kimi.com国际·主体月之暗面北京超长上下文见长最高 200 万字知识工作者首选。用户端套餐月付年付主要权益Free$0$0基础对话有每日限额标准套餐~$19更优惠更高频次优先响应高级套餐多档位最高省 $480全部功能最高配额国内版人民币¥0 – ¥399以 kimi.moonshot.cn 页面为准。Kimi Code 开发者套餐输出速度最高100 tokens/s5 小时 token 配额约 300–1,200 次 API 调用最大并发30API 计费模型输入/1M输出/1M上下文Kimi K2.6$0.60$2.50256K比 GPT-5.4 便宜 4-17x比 Claude Sonnet 4.6 便宜 5-6x。优点超长上下文国内最高 2M· 文档解析强PDF/Word/Excel· 编码能力全球前列缺点免费版限额严格 · 套餐描述不透明需登录查看 · 多模态能力较弱3.3 智谱清言 / GLMZ.AI官网chatglm.cn ·开发者平台bigmodel.cn / docs.z.ai ·主体智谱 AI北京国内首家上市 AI 大模型公司GLM-5 于 2026 年 2 月发布性能达全球前列。用户端套餐价格说明免费版¥0基础对话会员版官网为准更高配额优先 GLM-5GLM Coding Plan$18/月支持 Claude Code、Cursor、Cline面向开发者性价比最高的 Claude-alternative 订阅之一。来源GLM Coding Plan 2026API 计费模型输入/1M输出/1M上下文GLM-5$1.00$0.20200KGLM-5-Code$1.20–$5.00$0.30128KGLM-4.7$0.60——GLM-4.5 系列低成本——优点国内合规性最强 · GLM-5 性能全球前列 · Coding Plan 对开发工具支持度高 · 企业级服务体系完整缺点消费端套餐不透明 · API 价格高于 DeepSeek · 国际化知名度低 · 低档套餐联网受限3.4 MiniMax官网海螺 AIhailuoai.com ·开发者平台platform.minimaxi.com ·主体MiniMax上海音视频多模态能力著称MiniMax-M2.5 开源运行成本约$1/小时。用户端套餐价格说明免费版¥0基础对话图像生成有限额会员版官网为准更高配额AI 视频生成以音视频内容创作为核心卖点适合创意工作者。API 计费模型输入/1M上下文参数MiniMax-M2.5~$0.30200K230B10B active MoE优点音频合成TTS和视频生成能力领先 · MoE 架构运行成本极低 · 多模态综合缺点纯文本能力略弱于 DeepSeek/Kimi · 品牌知名度低 · 套餐信息更新不及时3.5 小米 MiMo官网mimo.mi.com ·主体小米集团2026 年 token 用量增速最快V2.5-Pro 以 1.02T 参数 MoE 架构登顶 OpenRouter 周度用量第一。用户端TokenPlan套餐月付说明入门档¥39/月88% 首购折扣轻度使用进阶档多档位月付/年付积分制企业档定制专属资源高并发TokenPlan 积分制比传统按次计费更灵活。API 完全兼容 OpenAI 和 Claude 格式。API 计费模型输入/1M上下文特点MiMo-V2-Pro$1.001MSWE-Bench 78%MiMo-V2.5-Pro$1.001MOpenRouter 用量第一MiMo-V2-Flash免费限额—开源轻量优点OpenRouter 用量全球第一~4.79T· API 价格极具竞争力 · 1M 超长上下文 · TokenPlan 灵活缺点品牌积累时间短 · 消费端产品体验待完善 · 主要优势集中在 API四、海外 TOP 5 大模型套餐4.1 ChatGPTOpenAI官网chatgpt.com ·定价openai.com/chatgpt/pricing全球用户量最大2026 年 4 月推出 GPT-5.5套餐扩展至六档。订阅套餐套餐月付年付主要功能Free$0$0GPT-4o-mini有限额无图像生成Go~$8—轻量付费休闲用户Plus$20—GPT-5.5扩展图像生成优先响应Pro低档$100—更高配额高级推理模型Pro高档$200—近无限制全模型访问Business$20/seat年付管理后台SAML SSO数据隐私Enterprise定制定制500 人团队最高合规2026-04 更新Business 降至 $20/seatPro 新增 $100 入门档GPT-5.5 成为 Plus 及以上默认模型。API 计费模型输入/1M输出/1MGPT-5.5$1.75$14.00GPT-5 mini$0.25$2.00GPT-5 nano$0.05$0.40优点全球用户量最大生态最完善插件、GPT Store· 套餐灵活$8 覆盖轻度用户 · GPT-5.5 综合能力强缺点$200 Pro 性价比争议大 · API 价格偏高 · 国内需FQ · Plus 高峰期降速4.2 ClaudeAnthropic官网claude.ai ·定价anthropic.com/pricing代码能力和安全性著称Claude Code 是 SWE-bench 评分最高工具~80.9%。订阅套餐套餐月付主要功能Free$0基础对话无 Claude CodePro$20标准配额含 Claude CodeMax 5x$100Pro 的 5 倍配额Max 20x$200Pro 的 20 倍Opus 4.61M 上下文Team$25–30/seat最少 2 人协作Cowork2026-01 上线Enterprise定制高合规专属支持API 计费模型输入/1M输出/1M上下文Claude Opus 4.6$5.00$25.001MClaude Sonnet 4.6$3.00$15.00200KClaude Haiku 4.5$1.00$5.00200K优点SWE-bench 最高分 · Claude Code 最强终端编码代理 · Max 套餐对重度用户友

2026年热门晋江AI获客公司口碑情况大揭秘

在当今竞争激烈的商业环境中，中小企业网络营销面临诸多难题。资源有限、渠道单一、跟不上短视频和AI搜索时代节奏等问题，让企业主们头疼不已。如何选择一家靠谱的AI获客公司，成为解决这些问题的关键。下面为你揭秘2026年热门晋江AI获客公司的…

2026/6/25 13:16:46 阅读更多

终极指南：使用Python快速进行FMI模型仿真

终极指南：使用Python快速进行FMI模型仿真【免费下载链接】FMPy Simulate Functional Mock-up Units (FMUs) in Python 项目地址: https://gitcode.com/gh_mirrors/fm/FMPy 在系统建模和仿真领域，FMI（Functional Mock-up Interface&am…

2026/6/25 13:16:46 阅读更多

AI产品经理必备：业务导向的评估计分板构建指南

1. 项目概述：为什么“评估计分板”是AI产品经理的生存刚需？我带过三支AI产品团队，从跨境物流智能客服、到B端合同审查Copilot，再到面向中小企业的AI营销文案生成器。每次新功能上线前，会议室里最常听到的一句话不是“用…

2026/6/25 13:16:03 阅读更多

字节后端开发实习生 AI Lab 面经：不太看 OS 和网络，更看代码能力和算法思维

这篇字节 AI Lab 面经和常见的后端面经不太一样。原始面经里已经明确提到，这个方向更偏“算法落地”，不会特别涉及操作系统、网络这些传统后端高频知识点，但会明显更看： C 基础手撕代码能力算法竞赛背景思维方式换句话…

2026/6/25 14:57:09 阅读更多

GeekDesk：桌面效率革命，极客工作流加速器

GeekDesk：桌面效率革命，极客工作流加速器【免费下载链接】GeekDesk 🔥小巧、美观的桌面快速启动工具 Small, beautiful desktop quickstart management tool with integrated Everything search 项目地址: https://gitcode.com/gh_mirrors…

2026/6/25 14:57:09 阅读更多

【HCIA-AI笔记（微认证1）】2.7 应用使能套件

课程目标与套件内容： 学习目标：了解昇腾应用使能集中包含的工具及工具组件的具体功能。套件内容：包括慢的SDK（含视觉、特征检索、推荐搜索、知识增强4种SDK）、mind cluster集群使能工具组件、mindedge端边设备使能组件…

2026/6/25 14:56:29 阅读更多

如何零成本体验Windows 12？这个网页版模拟器给你完整答案

如何零成本体验Windows 12？这个网页版模拟器给你完整答案【免费下载链接】win12 Windows 12 网页版，在线体验点击下面的链接在线体验项目地址: https://gitcode.com/gh_mirrors/wi/win12 想要体验最新的Windows 12界面但不想升级系统或购买新设…

2026/6/25 14:56:29 阅读更多

我必须先说一句：AI写3D代码，确实强。

以前我要翻三天文档、试七八种方案才能搭出来的模型交互管线，它十几秒全吐出来。GLTF加载、PBR材质、后处理特效，甚至我还没来得及想到的细节优化，它都能自动补全。比如这段，我让AI写一个简单得模型加载代码，说实话&am…

2026/6/25 14:56:29 阅读更多

团队级AI协同操作系统：五层架构实现Claude Code规模化落地

1. 这不是“AI工具使用指南”，而是一套团队级AI协同操作系统我带过三支不同规模的技术团队落地AI编码辅助，从5人初创小队到40人的跨职能研发组。前两年，我们和所有人一样，把Claude Code当成“高级版Copilot”——开发者自己装、自…

2026/6/25 14:55:48 阅读更多

面试辅助工具横评：我试了5款AI面试工具，最后留下了OfferGo

上半年跳槽，面了十几家公司。说句实话，不是能力不行，是面试现场太容易崩了。明明准备了一周，面试官换个问法脑子就一片白。面完之后那个懊悔——其实我会的。后来开始试市面上的AI面试辅助工具。前前后后装了5款，踩…

2026/6/25 11:52:18 阅读更多

MC-037 | 自定义 Skill 开发：创建你的AI能力模块

MONKEYCODE 教程系列 MonkeyCode教程及推广系列 MC-037 自定义 Skill 开发：创建你的AI能力模块 >官网链接注册更放心哦https://monkeycode-ai.com/?ic019e0aed-c823-783c-b08a-4f030f891e4e 系列: 不爱土豆唯爱马铃薯 MonkeyCode 教程系列字数: 约 1400 字…

2026/6/25 11:52:18 阅读更多

PEER模型：多模型协作范式的工程化实践指南

1. 项目概述：这不是又一个大模型，而是一次协作范式的重构 “META’s PEER: A Collaborative Language Model”这个标题里藏着一个被多数人忽略的关键词—— Collaborative （协作）。它不是在说“模型更大了”“参数更多了”“训练…

2026/6/25 11:54:48 阅读更多

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/25 1:04:34 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗？diff-pdf这款开…

2026/6/25 1:04:45 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/25 1:04:41 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/25 12:27:19 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/25 12:27:19 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/25 12:27:19 阅读更多

相关文章

2026年热门晋江AI获客公司口碑情况大揭秘

终极指南：使用Python快速进行FMI模型仿真

AI产品经理必备：业务导向的评估计分板构建指南

字节后端开发实习生 AI Lab 面经：不太看 OS 和网络，更看代码能力和算法思维

GeekDesk：桌面效率革命，极客工作流加速器

【HCIA-AI笔记（微认证1）】2.7 应用使能套件

如何零成本体验Windows 12？这个网页版模拟器给你完整答案

我必须先说一句：AI写3D代码，确实强。

团队级AI协同操作系统：五层架构实现Claude Code规模化落地

面试辅助工具横评：我试了5款AI面试工具，最后留下了OfferGo

MC-037 | 自定义 Skill 开发：创建你的AI能力模块

PEER模型：多模型协作范式的工程化实践指南

Google AI Studio 300美元额度的真相与实战指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因