DeepSeek V4 Preview 已在 2026 年 4 月 24 日上线。对 API 用户来说,最关键的变化不是标题里的热度,而是官方路线已经明确:当前模型 ID 是 deepseek-v4-flash 和 deepseek-v4-pro,同时支持 OpenAI 格式和 Anthropic 格式接口。旧的 deepseek-chat 与 deepseek-reasoner 现在只是兼容别名,分别指向 V4 Flash 的非思考和思考模式,并会在 2026 年 7 月 24 日 15:59 UTC 之后不可用。
所以第一步不是问 V4 API 是否无限免费。网页端和 App 适合试用,权重开放适合本地路线,但官方托管 API 是 token 计费合同。多数开发者应先用 Flash 做默认测试,只有在真实任务证明 Pro 的推理或 agentic coding 能抵消成本时再升级。
V4 Preview 到底改变了什么
V4 从传闻变成了可验证的官方 API。发布说明里有两个模型:V4 Pro 是 1.6T 总参数、49B 激活参数;V4 Flash 是 284B 总参数、13B 激活参数。DeepSeek 同时把 1M 上下文列为官方服务的标准能力。
这改变了开发者动作。旧内容很多还在讨论 V4 是否存在、是否能比较、是否只是跑分。现在开发者应该查的是模型列表、价格表、余额接口、429 限流和旧别名退役日期。旧比较页只能当作发布前背景,不能再替代今天的实现决策。
先选 Flash 还是 Pro,再改代码

| 选择 | 适合场景 | 边界 |
|---|---|---|
deepseek-v4-flash | 默认 API、成本敏感、低延迟、先做生产测试。 | 不是无限免费托管 API,仍按官方价格和余额规则扣费。 |
deepseek-v4-pro | 更难的推理、复杂 agentic coding、质量收益明显的任务。 | 价格高很多,必须用自己的任务证明值得。 |
deepseek-chat | 临时维持旧集成。 | 只是 V4 Flash 非思考模式的兼容别名。 |
deepseek-reasoner | 临时维持旧 reasoning 集成。 | 只是 V4 Flash 思考模式的兼容别名,同样有退役时间。 |
新项目直接写显式 V4 模型 ID。老项目要把别名清理当成迁移任务,而不是等到接口不可用再处理。
API 合同必须核验哪些点

OpenAI 格式 base URL 是 https://api.deepseek.com,Anthropic 格式 base URL 是 https://api.deepseek.com/anthropic。两 个 V4 模型都列出 1M 上下文和 384K 最大输出。
价格不能只写“便宜”。官方表按每 1M tokens 计价,并区分 cache hit 与 cache miss 输入价格。Flash 是 $0.028 cache-hit 输入、$0.14 cache-miss 输入、$0.28 输出;Pro 是 $0.145 cache-hit 输入、$1.74 cache-miss 输入、$3.48 输出。价格可能变化,生产文档应链接官方实时价格页。
余额和限流也要一起看。余额接口会区分 total、granted、topped-up balance;如果同时存在余额,费用优先扣 granted balance。限流是动态的,达到并发限制会收到 HTTP 429。客户端必须有退避和重试策略。
旧别名迁移清单

- 搜索代码里的
deepseek-chat和deepseek-reasoner。 - 判断每个调用应该迁到 Flash 还是 Pro。
- 显式测试思考和非思考模式,不要靠旧别名猜行为。
- 在部署环境调用
/models,确认两个 V4 ID 可见。 - 在服务端检查
/user/balance,不要把 key 或余额暴露到前端。 - 对 429 做退避、重试和用户提示。
- 在 2026 年 7 月 24 日退役窗口前完成别名移除。
如果你看到“DeepSeek V4 免费 API”说法,还要确认它指的是官方 API、第三方赠送额度、本地开源权重,还是网页会话逆向。它们的稳定性、计费和数据边界完全不同。
安全的第一轮测试可以很小:先用 Flash 跑一组短提示、一组长上下文提示和一组工具调用提示,记录输入、输出、延迟、429、余额变化和缓存命中情况。只有当这些记录证明 Pro 在关键任务上明显更稳,才把 Pro 放进默认路径。这样做比听一个“新王者”判断更可靠,也能避免把预览版上线当天的热度直接写进生产路由。
如果团队里已经有旧 DeepSeek 调用,最好把这轮测试和迁移合在一起做。先保留旧响应样本,再用 Flash 复跑同一组任务;如果输出风格、工具调用稳定性或长上下文恢复能力出现变化,就把差异写进发布说明。Pro 的测试也应放在同一张表里,避免只凭单次成功就改全局默认模型。这样迁移结论可复查,也便于回滚。
评价 V4 不要只看跑分

Flash 应作为默认评估路线,因为它更经济,也是旧别名背后的兼容目标。Pro 适合长上下文推理、复杂代码任务、工具调用链和失败成本较高的场景,但前提是你自己的任务能证明收益。
有用的评估表应包含任务类型、质量差异和成本差异三列。即使 Pro 在质量上更强,如果成本成倍增加,默认路线仍可能是 Flash。只要 Flash 通过验收,它就是多数 API 团队先试的路线。
常见问题
DeepSeek V4 API 免费吗?
官方托管 API 不是无限免费 API。DeepSeek 发布了 token 价格和余额规则。网页/App 体验、开源权重与托管 API 计费是三条不同路线。
新项目先用哪个模型?
多数项目先用 deepseek-v4-flash。只有真实任务证明 Pro 的质量收益能抵消成本时,再切到 deepseek-v4-pro。
deepseek-chat 和 deepseek-reasoner 还能用吗?
只能作为短期兼容桥。DeepSeek 官方说明它们会在 2026 年 7 月 24 日 15:59 UTC 之后不可用,新代码应使用显式 V4 模型 ID。
切换后要监控什么?
监控模型 ID、余额、缓存命中、输出成本、延迟和 429。这些指标能提前暴露大多数迁移错误。
