国内首个大模型分时计费落地！DeepSeek V4正式版7月中旬上线，API开启峰谷定价、日间调用价格翻倍-AITOP100,AI资讯

据DeepSeek 6月29日向全体API开发者推送的官方邮件通知，深度求索正式官宣两大行业重磅动作：‌DeepSeek V4完整正式版定于7月中旬全线上线‌，同步推出国内商用大模型行业首例‌峰谷分时计费机制‌，工作日日间核心调用时段API价格直接翻倍，非高峰时段维持现有低价不变。

工具地址：DeepSeek官网

DeepSeek V4

此次调整并非全时段涨价，而是依托价格杠杆分流算力拥堵、提升集群稳定性；平峰价格延续此前V4预览版永久降价标准，缓存命中输入、未命中输入、输出Token分档计价规则完整保留，仅对9:00-12:00、14:00-18:00两大企业集中办公时段执行2倍费率。

作为长期跟踪大模型API商业化、算力基础设施赛道的博主，本文结合官方完整价目表、厂商官方解读、算力行业专家分析，拆解峰谷定价底层逻辑、两类模型完整收费标准、对企业开发者的成本影响与应对方案，全文信息全部溯源官方邮件、第一财经、界面新闻公开报道，无AI虚构推演。

1. 事件完整时间线：从预览版永久降价到峰谷计费落地

梳理近两月DeepSeek定价与版本迭代节奏，能清晰看懂本次分时计费出台的前置背景：

‌2026年4月24日‌：DeepSeek V4预览版对外开放，同步推出DSpark投机解码加速框架，推理速度最高提升85%，上线初期执行阶段性优惠价；
‌2026年5月23日‌：官方宣布V4 Pro优惠转为永久基础定价，百万Token输出从24元降至6元，大幅拉低中小企业接入门槛，上线后全球API调用量连续9周走高；
‌2026年6月29日‌：向全部API用户推送邮件，确定7月中旬上线V4正式版，同步落地峰谷计费，高峰时段所有计费项统一翻倍；
‌调价缓冲规则‌：实际费率生效前24小时，官方会二次发送邮件提醒；用户若不接受新计费规则，可停止调用并申请账户余额退费，不存在强制扣费条款。

需要明确区分：本次峰谷定价‌仅针对API商用调用客户‌，网页端、App个人免费/订阅用户不受任何资费调整影响，日常对话、轻度试用成本无变化。

2. 完整峰谷定价明细：V4 Pro / V4 Flash分档费率对照

依据官方邮件公示的标准化价目表，将两款模型平峰、高峰收费标准统一整理，全部单位为「元/百万tokens」：

2.1 deepseek-v4-pro（旗舰万亿MoE模型，长文本、Agent、代码场景

计费分类	平时（谷段）价格	高峰时段价格	涨幅
输入（缓存命中）	0.025	0.05	2倍
输入（缓存未命中）	3	6	2倍
输出	6	12	2倍

2.2 deepseek-v4-flash（轻量化极速模型，日常对话、批量短文本）

计费分类	平时（谷段）价格	高峰时段价格	涨幅
输入（缓存命中）	0.02	0.04	2倍
输入（缓存未命中）	1	2	2倍
输出	2	4	2倍

高峰时段官方定义

北京时间每日 ‌9:00～12:00、14:00～18:00‌，合计7小时，覆盖国内绝大多数企业业务开发、客服问答、数据批量处理的核心工作窗口；夜间、凌晨、周末全天均为平价谷段，无额外加价。

计费逻辑补充说明

‌缓存命中输入成本极低‌：重复提问、固定知识库查询、高频通用Prompt可触发缓存机制，无论高峰平峰，输入成本仅几分钱/百万Token，是企业控成本核心抓手；
‌缓存未命中、输出为主要成本项‌：全新长文本、多步骤Agent推理、长篇内容生成，计费成本占总开支90%以上，日间批量执行会显著拉高账单。

3. 官方解读：推出峰谷定价的核心诉求（DeepSeek团队官方邮件原文观点）

官方在通知中明确，分时计费并非增收，核心目标有两点：

‌均衡算力资源负载，缓解高峰挤兑‌
V4预览版低价策略上线后，日间企业集中调用导致GPU集群满载，接口超时、排队限流频发，服务稳定性下滑；通过价差引导非实时任务错峰运行，削平日间算力峰值，减少用户等待延迟；
‌保障谷段低价普惠能力‌
如果持续统一一口价，平台需长期承担日间高算力补贴，长期无法维持夜间、周末的低价政策；峰谷分离模式下，闲时算力资源充分释放，中小企业、海外时区开发者可长期享受低成本调用。

4. 行业专家深度解读：算力正式“水电化”，大模型定价进入精细化时代

专家引述1：陈默，中国信通院人工智能算力中心高级研究员

“DeepSeek此次落地峰谷分时计费，是国内大模型从粗放统一按量计费，转向基础设施级精细化运营的标志性事件。在此之前，仅海外Anthropic推出过批量任务错峰折扣，国内厂商均采用全天统一Token单价。

算力和电力、云计算带宽逻辑高度趋同：日间需求集中、硬件资源饱和，边际成本大幅抬升；夜间算力闲置、硬件利用率不足30%。分时定价利用市场供需调节流量，既改善平台服务质量，也给企业提供成本优化路径，后续阿里云、腾讯混元等主流厂商大概率会跟进推出同类分时机制。”

专家引述2：周凯，AI产业垂直投资人，专注大模型API商业化赛道

“很多开发者直观认为是‘变相涨价’，但忽略两个关键前提：第一，平峰价格是此前永久降价后的低位标准，对比4月初原版定价仍降低75%；第二，仅实时交互业务受加价影响，离线批量任务、夜间自动化Agent完全不受冲击。

这套模式会倒逼企业重构调度逻辑：把数据清洗、报告生成、知识库批量更新等可延迟任务挪至夜间执行，仅客服、实时问答等刚需业务放在日间，长期整体算力开支不会出现大幅上涨，同时推动缓存、批量调度、模型路由等降本技术普及。”

5. 分类型开发者成本影响与实操降本方案

结合不同业务调用场景，区分受影响群体，并给出可落地控费手段：

‌成本明显上涨：日间高并发实时业务团队‌
适配场景：在线AI客服、前端实时问答、工作日多轮Agent交互、办公时段代码实时调试
降本方案：

加大语义缓存覆盖，高频客户问题、通用模板开启全局缓存，大幅压低输入Token成本；
拆分业务流量，非核心咨询任务设置队列延迟，自动调度至18点后谷段执行；
混合选型：简单对话切换V4 Flash，复杂长推理、代码任务再调用V4 Pro，分层控制开支。

‌几乎无成本变化：离线批量、海外时区开发团队‌适配场景：夜间数据处理、周报/报表自动生成、欧美海外客户服务、周末批量素材生成优势：全部调用落在平价谷段，计费标准维持此前低价，不受峰谷加价影响，海外创业团队、跨境AI服务商反而获得成本优势。
‌个人轻量开发者、高校科研用户‌网页端免费额度不受影响；少量API测试、小规模实验可全部安排在夜间/周末，账单无明显涨幅。

6. V4正式版配套能力升级，对冲分时加价带来的成本顾虑

官方同步披露，7月上线的完整正式版会整合全部前置技术优化，降低单位Token算力消耗，间接抵消日间加价成本：

内置DSpark投机解码全量部署‌

此前单独发布的加速框架原生集成，V4-Flash推理速度提升60%-85%，V4-Pro提速57%-78%，同等输出内容消耗Token更少，单次任务耗时缩短；

百万上下文显存优化‌

原生100万Token窗口优化分片调度，长文档、全仓库代码解析重复Token自动压缩，减少无效计费；

缓存策略智能调度‌

平台新增自动语义缓存引擎，无需人工配置，自动识别重复输入内容触发低价缓存计费，降低输入侧开支。

7. 行业长期趋势：三大变革由峰谷定价正式开启

‌大模型算力基础设施化，统一一口价时代落幕‌
过去两年行业依靠固定低价内卷抢占市场，随着企业规模化商用，算力供需矛盾凸显，分时、分级、分场景多元定价成为标配，单纯低价不再是核心竞争力，服务稳定性、调度灵活性权重持续提升；
‌企业AI开发流程走向错峰自动化‌
离线批量Agent、定时数据处理、夜间素材生成成为企业标配业务架构，AI任务不再集中在工作日白天执行，算力调度工程化能力成为技术团队新考核指标；
‌国内与海外定价体系逐步接轨‌
海外头部厂商早已推出错峰折扣、批量优惠，DeepSeek峰谷计费落地后，国产大模型商业化规则与全球市场对齐，利于跨境AI服务商统一成本测算、全球业务布局。

结语

DeepSeek V4正式版上线叠加峰谷分时定价，短期会对日间高实时调用的企业带来成本调整，但本质是行业告别低价无序内卷、走向精细化算力运营的必经阶段。

对于开发者而言，合理利用夜间、周末平价窗口，搭配语义缓存、模型分层选型、批量任务错峰调度，能够有效对冲日间加价带来的开支上涨；而V4正式版整合的DSpark推理加速、超长上下文优化等能力，也会从技术层面降低单位业务的Token消耗。
7月中旬版本上线前，官方会提前24小时发送调价提醒，有成本管控需求的团队可提前梳理业务调用时序，调整自动化任务运行时段。

AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息，带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容，请点击下方超链接查看

AI 创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码：

AITOP100平台官方交流社群二维码