按量计费API以 token 为单位付费适合开发者成本透明订阅制Consumer月付/年付固定费用解锁配额适合个人和非技术用户2026 年最显著的趋势国产模型在 token 使用量上已全面超越美国。据 OpenRouter 数据2026 年 3 月 30 日至 4 月 5 日一周内中国模型处理12.96 万亿 tokens美国模型仅3.03 万亿 tokens。全球 token 消耗量前六名全部来自中国。二、全球 Token 使用量排行榜数据来源OpenRouter Rankings · OpenRouter 2025 State of AI排名模型厂商周 Token 量估算主要优势1MiMo-V2.5-Pro小米~4.79T1T 参数 MoE1M 上下文2Kimi K2.6Moonshot AI~1.4T编码榜第一256K 上下文3DeepSeek-V4-FlashDeepSeek高极低成本1M 上下文4Qwen 系列阿里巴巴高多尺寸覆盖开源生态5GLM-5智谱 Z.AI中高国内首个上市大模型公司旗舰6Claude Sonnet 4.6Anthropic中SWE-bench 标杆综合能力领先7Gemini 3.1 FlashGoogle中速度快价格低多模态8GPT-5.5OpenAI中生态最广品牌溢价高9MiniMax-M2.5MiniMax中音视频多模态领先10Grok 4xAI低中实时 X 数据推理强关键数据时间中国模型美国模型全球总量2025-05首次超越4.12 万亿2.94 万亿—2026-03-30 ~ 04-0512.96 万亿3.03 万亿27 万亿中国模型在 OpenRouter 平台占比从 2025 年初 2% 升至 2026 年 Q245%。DeepSeek 开源份额从 ~80% 降至 ~40%被 Qwen、MiMo 分流。三、国内 TOP 5 大模型套餐3.1 DeepSeek官网chat.deepseek.com ·API 文档api-docs.deepseek.com ·主体深度求索杭州DeepSeek 以极低 API 价格和顶级推理能力著称颠覆美国主导的定价体系。用户端套餐价格说明免费版¥0全部功能含 DeepSeek-V4-Flash 和深度思考订阅制无官方不提供消费者月付套餐差异化策略超低 API 价格服务开发者消费端完全免费获客。API 计费/1M tokens模型输入缓存命中输出上下文DeepSeek-V4-Flash$0.14$0.0028$0.281MDeepSeek-V4-Pro折扣 75%$0.435$0.003625$0.871MDeepSeek-V4-Pro原价~$1.74—~$3.481MDeepSeek-V3旧~$0.20——128K75% 折扣有效期至 2026-05-05 15:59 UTC来源The Next Web优点免费版功能完整 · API 价格全球最低之一比 GPT-5.5 便宜 35-100x· 开源可本地部署缺点无消费者订阅套餐 · 高峰期偶发不稳定 · 无多模态 · 实时信息有限3.2 KimiMoonshot AI官网kimi.moonshot.cn国内/ kimi.com国际·主体月之暗面北京超长上下文见长最高 200 万字知识工作者首选。用户端套餐月付年付主要权益Free$0$0基础对话有每日限额标准套餐~$19更优惠更高频次优先响应高级套餐多档位最高省 $480全部功能最高配额国内版人民币¥0 – ¥399以 kimi.moonshot.cn 页面为准。Kimi Code 开发者套餐输出速度最高100 tokens/s5 小时 token 配额约 300–1,200 次 API 调用最大并发30API 计费模型输入/1M输出/1M上下文Kimi K2.6$0.60$2.50256K比 GPT-5.4 便宜 4-17x比 Claude Sonnet 4.6 便宜 5-6x。优点超长上下文国内最高 2M· 文档解析强PDF/Word/Excel· 编码能力全球前列缺点免费版限额严格 · 套餐描述不透明需登录查看 · 多模态能力较弱3.3 智谱清言 / GLMZ.AI官网chatglm.cn ·开发者平台bigmodel.cn / docs.z.ai ·主体智谱 AI北京国内首家上市 AI 大模型公司GLM-5 于 2026 年 2 月发布性能达全球前列。用户端套餐价格说明免费版¥0基础对话会员版官网为准更高配额优先 GLM-5GLM Coding Plan$18/月支持 Claude Code、Cursor、Cline面向开发者性价比最高的 Claude-alternative 订阅之一。来源GLM Coding Plan 2026API 计费模型输入/1M输出/1M上下文GLM-5$1.00$0.20200KGLM-5-Code$1.20–$5.00$0.30128KGLM-4.7$0.60——GLM-4.5 系列低成本——优点国内合规性最强 · GLM-5 性能全球前列 · Coding Plan 对开发工具支持度高 · 企业级服务体系完整缺点消费端套餐不透明 · API 价格高于 DeepSeek · 国际化知名度低 · 低档套餐联网受限3.4 MiniMax官网海螺 AIhailuoai.com ·开发者平台platform.minimaxi.com ·主体MiniMax上海音视频多模态能力著称MiniMax-M2.5 开源运行成本约$1/小时。用户端套餐价格说明免费版¥0基础对话图像生成有限额会员版官网为准更高配额AI 视频生成以音视频内容创作为核心卖点适合创意工作者。API 计费模型输入/1M上下文参数MiniMax-M2.5~$0.30200K230B10B active MoE优点音频合成TTS和视频生成能力领先 · MoE 架构运行成本极低 · 多模态综合缺点纯文本能力略弱于 DeepSeek/Kimi · 品牌知名度低 · 套餐信息更新不及时3.5 小米 MiMo官网mimo.mi.com ·主体小米集团2026 年 token 用量增速最快V2.5-Pro 以 1.02T 参数 MoE 架构登顶 OpenRouter 周度用量第一。用户端TokenPlan套餐月付说明入门档¥39/月88% 首购折扣轻度使用进阶档多档位月付/年付积分制企业档定制专属资源高并发TokenPlan 积分制比传统按次计费更灵活。API 完全兼容 OpenAI 和 Claude 格式。API 计费模型输入/1M上下文特点MiMo-V2-Pro$1.001MSWE-Bench 78%MiMo-V2.5-Pro$1.001MOpenRouter 用量第一MiMo-V2-Flash免费限额—开源轻量优点OpenRouter 用量全球第一~4.79T· API 价格极具竞争力 · 1M 超长上下文 · TokenPlan 灵活缺点品牌积累时间短 · 消费端产品体验待完善 · 主要优势集中在 API四、海外 TOP 5 大模型套餐4.1 ChatGPTOpenAI官网chatgpt.com ·定价openai.com/chatgpt/pricing全球用户量最大2026 年 4 月推出 GPT-5.5套餐扩展至六档。订阅套餐套餐月付年付主要功能Free$0$0GPT-4o-mini有限额无图像生成Go~$8—轻量付费休闲用户Plus$20—GPT-5.5扩展图像生成优先响应Pro低档$100—更高配额高级推理模型Pro高档$200—近无限制全模型访问Business$20/seat年付管理后台SAML SSO数据隐私Enterprise定制定制500 人团队最高合规2026-04 更新Business 降至 $20/seatPro 新增 $100 入门档GPT-5.5 成为 Plus 及以上默认模型。API 计费模型输入/1M输出/1MGPT-5.5$1.75$14.00GPT-5 mini$0.25$2.00GPT-5 nano$0.05$0.40优点全球用户量最大生态最完善插件、GPT Store· 套餐灵活$8 覆盖轻度用户 · GPT-5.5 综合能力强缺点$200 Pro 性价比争议大 · API 价格偏高 · 国内需FQ · Plus 高峰期降速4.2 ClaudeAnthropic官网claude.ai ·定价anthropic.com/pricing代码能力和安全性著称Claude Code 是 SWE-bench 评分最高工具~80.9%。订阅套餐套餐月付主要功能Free$0基础对话无 Claude CodePro$20标准配额含 Claude CodeMax 5x$100Pro 的 5 倍配额Max 20x$200Pro 的 20 倍Opus 4.61M 上下文Team$25–30/seat最少 2 人协作Cowork2026-01 上线Enterprise定制高合规专属支持API 计费模型输入/1M输出/1M上下文Claude Opus 4.6$5.00$25.001MClaude Sonnet 4.6$3.00$15.00200KClaude Haiku 4.5$1.00$5.00200K优点SWE-bench 最高分 · Claude Code 最强终端编码代理 · Max 套餐对重度用户友
全局概览:两条赛道,一场博弈
发布时间:2026/6/25 13:17:08
按量计费API以 token 为单位付费适合开发者成本透明订阅制Consumer月付/年付固定费用解锁配额适合个人和非技术用户2026 年最显著的趋势国产模型在 token 使用量上已全面超越美国。据 OpenRouter 数据2026 年 3 月 30 日至 4 月 5 日一周内中国模型处理12.96 万亿 tokens美国模型仅3.03 万亿 tokens。全球 token 消耗量前六名全部来自中国。二、全球 Token 使用量排行榜数据来源OpenRouter Rankings · OpenRouter 2025 State of AI排名模型厂商周 Token 量估算主要优势1MiMo-V2.5-Pro小米~4.79T1T 参数 MoE1M 上下文2Kimi K2.6Moonshot AI~1.4T编码榜第一256K 上下文3DeepSeek-V4-FlashDeepSeek高极低成本1M 上下文4Qwen 系列阿里巴巴高多尺寸覆盖开源生态5GLM-5智谱 Z.AI中高国内首个上市大模型公司旗舰6Claude Sonnet 4.6Anthropic中SWE-bench 标杆综合能力领先7Gemini 3.1 FlashGoogle中速度快价格低多模态8GPT-5.5OpenAI中生态最广品牌溢价高9MiniMax-M2.5MiniMax中音视频多模态领先10Grok 4xAI低中实时 X 数据推理强关键数据时间中国模型美国模型全球总量2025-05首次超越4.12 万亿2.94 万亿—2026-03-30 ~ 04-0512.96 万亿3.03 万亿27 万亿中国模型在 OpenRouter 平台占比从 2025 年初 2% 升至 2026 年 Q245%。DeepSeek 开源份额从 ~80% 降至 ~40%被 Qwen、MiMo 分流。三、国内 TOP 5 大模型套餐3.1 DeepSeek官网chat.deepseek.com ·API 文档api-docs.deepseek.com ·主体深度求索杭州DeepSeek 以极低 API 价格和顶级推理能力著称颠覆美国主导的定价体系。用户端套餐价格说明免费版¥0全部功能含 DeepSeek-V4-Flash 和深度思考订阅制无官方不提供消费者月付套餐差异化策略超低 API 价格服务开发者消费端完全免费获客。API 计费/1M tokens模型输入缓存命中输出上下文DeepSeek-V4-Flash$0.14$0.0028$0.281MDeepSeek-V4-Pro折扣 75%$0.435$0.003625$0.871MDeepSeek-V4-Pro原价~$1.74—~$3.481MDeepSeek-V3旧~$0.20——128K75% 折扣有效期至 2026-05-05 15:59 UTC来源The Next Web优点免费版功能完整 · API 价格全球最低之一比 GPT-5.5 便宜 35-100x· 开源可本地部署缺点无消费者订阅套餐 · 高峰期偶发不稳定 · 无多模态 · 实时信息有限3.2 KimiMoonshot AI官网kimi.moonshot.cn国内/ kimi.com国际·主体月之暗面北京超长上下文见长最高 200 万字知识工作者首选。用户端套餐月付年付主要权益Free$0$0基础对话有每日限额标准套餐~$19更优惠更高频次优先响应高级套餐多档位最高省 $480全部功能最高配额国内版人民币¥0 – ¥399以 kimi.moonshot.cn 页面为准。Kimi Code 开发者套餐输出速度最高100 tokens/s5 小时 token 配额约 300–1,200 次 API 调用最大并发30API 计费模型输入/1M输出/1M上下文Kimi K2.6$0.60$2.50256K比 GPT-5.4 便宜 4-17x比 Claude Sonnet 4.6 便宜 5-6x。优点超长上下文国内最高 2M· 文档解析强PDF/Word/Excel· 编码能力全球前列缺点免费版限额严格 · 套餐描述不透明需登录查看 · 多模态能力较弱3.3 智谱清言 / GLMZ.AI官网chatglm.cn ·开发者平台bigmodel.cn / docs.z.ai ·主体智谱 AI北京国内首家上市 AI 大模型公司GLM-5 于 2026 年 2 月发布性能达全球前列。用户端套餐价格说明免费版¥0基础对话会员版官网为准更高配额优先 GLM-5GLM Coding Plan$18/月支持 Claude Code、Cursor、Cline面向开发者性价比最高的 Claude-alternative 订阅之一。来源GLM Coding Plan 2026API 计费模型输入/1M输出/1M上下文GLM-5$1.00$0.20200KGLM-5-Code$1.20–$5.00$0.30128KGLM-4.7$0.60——GLM-4.5 系列低成本——优点国内合规性最强 · GLM-5 性能全球前列 · Coding Plan 对开发工具支持度高 · 企业级服务体系完整缺点消费端套餐不透明 · API 价格高于 DeepSeek · 国际化知名度低 · 低档套餐联网受限3.4 MiniMax官网海螺 AIhailuoai.com ·开发者平台platform.minimaxi.com ·主体MiniMax上海音视频多模态能力著称MiniMax-M2.5 开源运行成本约$1/小时。用户端套餐价格说明免费版¥0基础对话图像生成有限额会员版官网为准更高配额AI 视频生成以音视频内容创作为核心卖点适合创意工作者。API 计费模型输入/1M上下文参数MiniMax-M2.5~$0.30200K230B10B active MoE优点音频合成TTS和视频生成能力领先 · MoE 架构运行成本极低 · 多模态综合缺点纯文本能力略弱于 DeepSeek/Kimi · 品牌知名度低 · 套餐信息更新不及时3.5 小米 MiMo官网mimo.mi.com ·主体小米集团2026 年 token 用量增速最快V2.5-Pro 以 1.02T 参数 MoE 架构登顶 OpenRouter 周度用量第一。用户端TokenPlan套餐月付说明入门档¥39/月88% 首购折扣轻度使用进阶档多档位月付/年付积分制企业档定制专属资源高并发TokenPlan 积分制比传统按次计费更灵活。API 完全兼容 OpenAI 和 Claude 格式。API 计费模型输入/1M上下文特点MiMo-V2-Pro$1.001MSWE-Bench 78%MiMo-V2.5-Pro$1.001MOpenRouter 用量第一MiMo-V2-Flash免费限额—开源轻量优点OpenRouter 用量全球第一~4.79T· API 价格极具竞争力 · 1M 超长上下文 · TokenPlan 灵活缺点品牌积累时间短 · 消费端产品体验待完善 · 主要优势集中在 API四、海外 TOP 5 大模型套餐4.1 ChatGPTOpenAI官网chatgpt.com ·定价openai.com/chatgpt/pricing全球用户量最大2026 年 4 月推出 GPT-5.5套餐扩展至六档。订阅套餐套餐月付年付主要功能Free$0$0GPT-4o-mini有限额无图像生成Go~$8—轻量付费休闲用户Plus$20—GPT-5.5扩展图像生成优先响应Pro低档$100—更高配额高级推理模型Pro高档$200—近无限制全模型访问Business$20/seat年付管理后台SAML SSO数据隐私Enterprise定制定制500 人团队最高合规2026-04 更新Business 降至 $20/seatPro 新增 $100 入门档GPT-5.5 成为 Plus 及以上默认模型。API 计费模型输入/1M输出/1MGPT-5.5$1.75$14.00GPT-5 mini$0.25$2.00GPT-5 nano$0.05$0.40优点全球用户量最大生态最完善插件、GPT Store· 套餐灵活$8 覆盖轻度用户 · GPT-5.5 综合能力强缺点$200 Pro 性价比争议大 · API 价格偏高 · 国内需FQ · Plus 高峰期降速4.2 ClaudeAnthropic官网claude.ai ·定价anthropic.com/pricing代码能力和安全性著称Claude Code 是 SWE-bench 评分最高工具~80.9%。订阅套餐套餐月付主要功能Free$0基础对话无 Claude CodePro$20标准配额含 Claude CodeMax 5x$100Pro 的 5 倍配额Max 20x$200Pro 的 20 倍Opus 4.61M 上下文Team$25–30/seat最少 2 人协作Cowork2026-01 上线Enterprise定制高合规专属支持API 计费模型输入/1M输出/1M上下文Claude Opus 4.6$5.00$25.001MClaude Sonnet 4.6$3.00$15.00200KClaude Haiku 4.5$1.00$5.00200K优点SWE-bench 最高分 · Claude Code 最强终端编码代理 · Max 套餐对重度用户友