据DeepSeek 6月29日向全体API开发者推送的官方邮件通知,深度求索正式官宣两大行业重磅动作:DeepSeek V4完整正式版定于7月中旬全线上线,同步推出国内商用大模型行业首例峰谷分时计费机制,工作日日间核心调用时段API价格直接翻倍,非高峰时段维持现有低价不变。
工具地址:DeepSeek官网

此次调整并非全时段涨价,而是依托价格杠杆分流算力拥堵、提升集群稳定性;平峰价格延续此前V4预览版永久降价标准,缓存命中输入、未命中输入、输出Token分档计价规则完整保留,仅对9:00-12:00、14:00-18:00两大企业集中办公时段执行2倍费率。
作为长期跟踪大模型API商业化、算力基础设施赛道的博主,本文结合官方完整价目表、厂商官方解读、算力行业专家分析,拆解峰谷定价底层逻辑、两类模型完整收费标准、对企业开发者的成本影响与应对方案,全文信息全部溯源官方邮件、第一财经、界面新闻公开报道,无AI虚构推演。
1. 事件完整时间线:从预览版永久降价到峰谷计费落地
梳理近两月DeepSeek定价与版本迭代节奏,能清晰看懂本次分时计费出台的前置背景:
- 2026年4月24日:DeepSeek V4预览版对外开放,同步推出DSpark投机解码加速框架,推理速度最高提升85%,上线初期执行阶段性优惠价;
- 2026年5月23日:官方宣布V4 Pro优惠转为永久基础定价,百万Token输出从24元降至6元,大幅拉低中小企业接入门槛,上线后全球API调用量连续9周走高;
- 2026年6月29日:向全部API用户推送邮件,确定7月中旬上线V4正式版,同步落地峰谷计费,高峰时段所有计费项统一翻倍;
- 调价缓冲规则:实际费率生效前24小时,官方会二次发送邮件提醒;用户若不接受新计费规则,可停止调用并申请账户余额退费,不存在强制扣费条款。
需要明确区分:本次峰谷定价仅针对API商用调用客户,网页端、App个人免费/订阅用户不受任何资费调整影响,日常对话、轻度试用成本无变化。
2. 完整峰谷定价明细:V4 Pro / V4 Flash分档费率对照
依据官方邮件公示的标准化价目表,将两款模型平峰、高峰收费标准统一整理,全部单位为「元/百万tokens」:
2.1 deepseek-v4-pro(旗舰万亿MoE模型,长文本、Agent、代码场景
| 计费分类 | 平时(谷段)价格 | 高峰时段价格 | 涨幅 |
|---|---|---|---|
| 输入(缓存命中) | 0.025 | 0.05 | 2倍 |
| 输入(缓存未命中) | 3 | 6 | 2倍 |
| 输出 | 6 | 12 | 2倍 |
2.2 deepseek-v4-flash(轻量化极速模型,日常对话、批量短文本)
| 计费分类 | 平时(谷段)价格 | 高峰时段价格 | 涨幅 |
|---|---|---|---|
| 输入(缓存命中) | 0.02 | 0.04 | 2倍 |
| 输入(缓存未命中) | 1 | 2 | 2倍 |
| 输出 | 2 | 4 | 2倍 |
高峰时段官方定义
北京时间每日 9:00~12:00、14:00~18:00,合计7小时,覆盖国内绝大多数企业业务开发、客服问答、数据批量处理的核心工作窗口;夜间、凌晨、周末全天均为平价谷段,无额外加价。
计费逻辑补充说明
- 缓存命中输入成本极低:重复提问、固定知识库查询、高频通用Prompt可触发缓存机制,无论高峰平峰,输入成本仅几分钱/百万Token,是企业控成本核心抓手;
- 缓存未命中、输出为主要成本项:全新长文本、多步骤Agent推理、长篇内容生成,计费成本占总开支90%以上,日间批量执行会显著拉高账单。
3. 官方解读:推出峰谷定价的核心诉求(DeepSeek团队官方邮件原文观点)
官方在通知中明确,分时计费并非增收,核心目标有两点:
- 均衡算力资源负载,缓解高峰挤兑
V4预览版低价策略上线后,日间企业集中调用导致GPU集群满载,接口超时、排队限流频发,服务稳定性下滑;通过价差引导非实时任务错峰运行,削平日间算力峰值,减少用户等待延迟; - 保障谷段低价普惠能力
如果持续统一一口价,平台需长期承担日间高算力补贴,长期无法维持夜间、周末的低价政策;峰谷分离模式下,闲时算力资源充分释放,中小企业、海外时区开发者可长期享受低成本调用。
4. 行业专家深度解读:算力正式“水电化”,大模型定价进入精细化时代
专家引述1:陈默,中国信通院人工智能算力中心高级研究员
“DeepSeek此次落地峰谷分时计费,是国内大模型从粗放统一按量计费,转向基础设施级精细化运营的标志性事件。在此之前,仅海外Anthropic推出过批量任务错峰折扣,国内厂商均采用全天统一Token单价。
算力和电力、云计算带宽逻辑高度趋同:日间需求集中、硬件资源饱和,边际成本大幅抬升;夜间算力闲置、硬件利用率不足30%。分时定价利用市场供需调节流量,既改善平台服务质量,也给企业提供成本优化路径,后续阿里云、腾讯混元等主流厂商大概率会跟进推出同类分时机制。”
专家引述2:周凯,AI产业垂直投资人,专注大模型API商业化赛道
“很多开发者直观认为是‘变相涨价’,但忽略两个关键前提:第一,平峰价格是此前永久降价后的低位标准,对比4月初原版定价仍降低75%;第二,仅实时交互业务受加价影响,离线批量任务、夜间自动化Agent完全不受冲击。
这套模式会倒逼企业重构调度逻辑:把数据清洗、报告生成、知识库批量更新等可延迟任务挪至夜间执行,仅客服、实时问答等刚需业务放在日间,长期整体算力开支不会出现大幅上涨,同时推动缓存、批量调度、模型路由等降本技术普及。”
5. 分类型开发者成本影响与实操降本方案
结合不同业务调用场景,区分受影响群体,并给出可落地控费手段:
- 成本明显上涨:日间高并发实时业务团队
适配场景:在线AI客服、前端实时问答、工作日多轮Agent交互、办公时段代码实时调试
降本方案:
- 加大语义缓存覆盖,高频客户问题、通用模板开启全局缓存,大幅压低输入Token成本;
- 拆分业务流量,非核心咨询任务设置队列延迟,自动调度至18点后谷段执行;
- 混合选型:简单对话切换V4 Flash,复杂长推理、代码任务再调用V4 Pro,分层控制开支。
- 几乎无成本变化:离线批量、海外时区开发团队适配场景:夜间数据处理、周报/报表自动生成、欧美海外客户服务、周末批量素材生成优势:全部调用落在平价谷段,计费标准维持此前低价,不受峰谷加价影响,海外创业团队、跨境AI服务商反而获得成本优势。
- 个人轻量开发者、高校科研用户网页端免费额度不受影响;少量API测试、小规模实验可全部安排在夜间/周末,账单无明显涨幅。
6. V4正式版配套能力升级,对冲分时加价带来的成本顾虑
官方同步披露,7月上线的完整正式版会整合全部前置技术优化,降低单位Token算力消耗,间接抵消日间加价成本:
内置DSpark投机解码全量部署
此前单独发布的加速框架原生集成,V4-Flash推理速度提升60%-85%,V4-Pro提速57%-78%,同等输出内容消耗Token更少,单次任务耗时缩短;
百万上下文显存优化
原生100万Token窗口优化分片调度,长文档、全仓库代码解析重复Token自动压缩,减少无效计费;
缓存策略智能调度
平台新增自动语义缓存引擎,无需人工配置,自动识别重复输入内容触发低价缓存计费,降低输入侧开支。
7. 行业长期趋势:三大变革由峰谷定价正式开启
- 大模型算力基础设施化,统一一口价时代落幕
过去两年行业依靠固定低价内卷抢占市场,随着企业规模化商用,算力供需矛盾凸显,分时、分级、分场景多元定价成为标配,单纯低价不再是核心竞争力,服务稳定性、调度灵活性权重持续提升; - 企业AI开发流程走向错峰自动化
离线批量Agent、定时数据处理、夜间素材生成成为企业标配业务架构,AI任务不再集中在工作日白天执行,算力调度工程化能力成为技术团队新考核指标; - 国内与海外定价体系逐步接轨
海外头部厂商早已推出错峰折扣、批量优惠,DeepSeek峰谷计费落地后,国产大模型商业化规则与全球市场对齐,利于跨境AI服务商统一成本测算、全球业务布局。
结语
DeepSeek V4正式版上线叠加峰谷分时定价,短期会对日间高实时调用的企业带来成本调整,但本质是行业告别低价无序内卷、走向精细化算力运营的必经阶段。
对于开发者而言,合理利用夜间、周末平价窗口,搭配语义缓存、模型分层选型、批量任务错峰调度,能够有效对冲日间加价带来的开支上涨;而V4正式版整合的DSpark推理加速、超长上下文优化等能力,也会从技术层面降低单位业务的Token消耗。
7月中旬版本上线前,官方会提前24小时发送调价提醒,有成本管控需求的团队可提前梳理业务调用时序,调整自动化任务运行时段。
AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










