DeepSeek V4-Pro 模型 API 永久降价,搅动 AI 编程市场格局! 【DeepSeek-V4-Pro 模型 API 永久降价】DeepSeek 之于大模型就像蜜雪冰城之于奶茶性价比出色。最近DeepSeek 官方宣布DeepSeek-V4-Pro 模型 API 将永久降价。同时API 已完成输出提速与服务扩容速度更快服务更稳定默认支持 500 并发企业用户可以在线申请更高并发。【DeepSeek 降价时间线梳理】4 月 24 日DeepSeek V4 预览版正式发布4 月 25 日DeepSeek 宣布 V4-Pro 开启 2.5 折优惠4 月 26 日DeepSeek 宣布缓存命中价格调整为首发价的十分之一4 月 28 日DeepSeek 宣布 V4-Pro 的 2.5 折优惠延期至 5 月 31 日5 月 22 日DeepSeek 宣布 V4-Pro 永久降价为原价的四分之一。调整之后DeepSeek-V4-Pro 输入缓存命中价格从 0.1 元每百万 Tokens 降至 0.025 元输入缓存未命中价格从 12 元每百万 Tokens 降至 3 元输出价格从 24 元每百万 Tokens 降至 6 元。叠加默认 500 并发和服务提速后官方 API 对开发者和企业的吸引力进一步提高。【价格下调的影响】价格下调最直接的影响是把任务成本推到开发者决策的更前端。在代码场景里Tokens 消耗容易放大长上下文、代码库分析等这些高消耗场景开始更接近个人开发者和小团队的预算范围。过去开发者选择 Claude、OpenAI 或 Gemini主要看模型能力等因素。DeepSeek 打骨折的永久降价意味着在绝对的性价比面前开发者使用习惯也可改变。DeepSeek 用低价、开源和强推理能力持续建立大模型市场的价格优势。对国内模型厂商来说V4-Pro 永久降价相当于重新划了一条 API 定价线。智谱、MiniMax、月之暗面这类模型压力大而 Claude、OpenAI、Gemini 等海外头部模型短期冲击相对有限。若 DeepSeek 后续推出类似 Claude Code 的编码工具价格敏感的开发者群体会更容易被吸引过来。【DeepSeek 定价哲学及背后方向】梁文锋此前解释DeepSeek 按自己的节奏做事核算成本后定价原则是不贴钱也不赚取暴利。降价一部分来自下一代模型结构探索带来的成本下降另一部分原因是 API 和 AI 都应该是普惠的、人人用得起的东西。X 平台博主 bookwormengr 认为DeepSeek 的真正目标未必是和智谱等竞争也不是急着补齐产品线而是推动一套更便宜、更分散的 AI 硬件生态成形。其长期价值不只在模型本身而在于让更多国产存储等硬件进入大模型训练与推理体系。一系列降价公告里缓存命中价格下降值得关注。在大模型推理过程中KV Cache 是关键成本项。普通聊天里缓存压力不明显但在代码、长文档和 Agent 任务中成本结构会变化。bookwormengr 估算DeepSeek V4 只需要约 5.48GB HBM而 GLM5 约为 60GBQwen3 - 235B - A22B 约为 89GB。缓存命中价格下降后重复上下文的成本会明显变低。【对 AI 编程市场的影响】最先被牵动的是 AI 编程工具的订阅模式。AI 编程已从单次补全迭代为全流程 Agent 自动化编码单次任务 Token 消耗大幅提升。当底层 API 大幅降价Coding Plan 必须找到新的支撑点更可能落在工程能力上。API 中转站也需重新定位。对个人开发者来说便宜和好用重要对企业来说稳定、可审计、可控、可迁移更重要。低价之后更值得追问的是开发者入口究竟掌握在谁手里。Google CEO Sundar Pichai 承认Google 在 agentic coding 能力上有差距关键是把模型放到真实世界里使用让数据回流继续迭代。【DeepSeek 围绕 Agent 的动作】从公开招聘动作看DeepSeek 近期围绕 Agent 的动作变得密集岗位里出现了 Agent 深度学习算法研究员等角色。DeepSeek 资深研究员陈德里提到要从零开始构建 Code Harness。在 Agent 产品中模型负责理解和生成Harness 负责把模型能力带入真实工程环境。崔添翼加入 DeepSeek 受关注和 Code Agent 的工程属性有关。他有丰富的量化交易系统经验这些经验放到 Agent Harness 上至少在工程范式上是相通的。Agent 工具的产品能力包括权限、审计等。如果 DeepSeek 能把低成本模型、Code Harness、本地部署、企业级权限控制结合起来在政企等对数据敏感的行业里会有更强的替代价值。DeepSeek 做中国版 Claude Code 的逻辑在于低价 tokens 吸引开发者低缓存价格降低 Agent 任务运行成本Code Harness 让模型进入开发环境真实工作流帮助改进模型和产品。