DeepSeek V4 Preview は 2026年4月24日に公開されました。APIユーザーにとって重要なのは、公式のモデルIDが deepseek-v4-flash と deepseek-v4-pro になったことです。旧来の deepseek-chat と deepseek-reasoner は、今は V4 Flash の非思考/思考モードへの互換aliasですが、2026年7月24日 15:59 UTC 後に使えなくなると案内されています。
最初に見るべきなのは「完全無料APIか」ではありません。Web とアプリは試用に便利で、open weights はローカル利用の道を開きます。しかし公式 hosted API は token pricing と balance に基づく契約です。まず Flash で評価し、難しい推論や agentic coding で明確な差が出たときだけ Pro を使うのが安全です。
V4 Preview で何が変わったか
V4 は噂ではなく、公式APIで確認できるリリースになりました。DeepSeek は V4 Pro を 1.6T total parameters / 49B active parameters、V4 Flash を 284B total parameters / 13B active parameters と説明し、公式サービスでは 1M context を標準にしています。
これにより、古い比較記事の読み方も変わります。以前は V4 の存在や公開状態を確認する段階でした。今は model list、pricing、balance、rate limit、alias retirement を確認して実装に進む段階です。
Flash か Pro かを先に決める

| 選択 | 使い始める場面 | 注意点 |
|---|---|---|
deepseek-v4-flash | 低コスト、低遅延、通常のAPI評価、本番前テスト。 | 無制限無料APIではなく、価格とbalance rulesに従う。 |
deepseek-v4-pro | 難しい推論、agentic coding、品質差が重要な業務。 | 価格が高いので、自分のworkloadで価値を確認する。 |
deepseek-chat | 古い実装を短期的に維持する場合。 | V4 Flash non-thinking へのaliasであり、長期IDではない。 |
deepseek-reasoner | 古いreasoning実装を短期維持する場合。 | V4 Flash thinking へのaliasで、同じ退役日がある。 |
新規コードでは明示的な V4 ID を使い、旧コードではalias削除を移行タスクとして扱います。
API契約で確認する項目

OpenAI形式の base URL は https://api.deepseek.com、Anthropic形 式は https://api.deepseek.com/anthropic です。両方のV4モデルに 1M context と 384K max output が記載されています。
価格は「安い」という表現だけでは不十分です。Flash は 1M tokens あたり cache-hit input が $0.028、cache-miss input が $0.14、output が $0.28。Pro は $0.145、$1.74、$3.48 です。価格は変更される可能性があるため、運用文書では公式価格ページを参照します。
Balance endpoint は total、granted、topped-up balance を分けて返します。rate limit は動的で、制限に達すると HTTP 429 が返ります。クライアント側では backoff と retry を前提にします。
旧aliasからの移行チェック

deepseek-chatとdeepseek-reasonerを検索します。- Flash に移す呼び出しと Pro に移す呼び出しを分けます。
- thinking / non-thinking の挙動を明示的にテストします。
/modelsでV4 IDが見えることを確認します。/user/balanceはサーバー側で確認します。- 429 に対する retry と backoff を実装します。
- 2026年7月24日の期限前にalias依存を外します。
「DeepSeek V4 free API」という表現を見た場合も、公式API、trial credits、open weights、web-session workaround のどれかを必ず分けます。
最初の検証は小さく固定します。Flash で短いプロンプト、長いコンテキスト、tool-heavy な処理を一つずつ走らせ、latency、output tokens、429、balance の変化、回答品質を記録します。その同じ条件で Pro を試し、差が明確なタスクだけ Pro に上げます。これなら Preview 初日の熱量ではなく、自分の受け入れ基準でルートを決められます。
V4を過大評価せずに試す

最初は Flash で十分です。コストが低く、互換aliasの裏側でも使われるルートです。Pro は長文推論、コードエージェント、失敗コストが高い業務で試す価値がありますが、一般的なベンチマークだけで結論を出すべきではありません。
評価表には task family、quality delta、cost delta を入れます。Flash が acceptance tests を通るなら、多くのAPIチームにとって最初の選択肢は Flash です。
よくある質問
DeepSeek V4 API は無料ですか?
公式 hosted API は無制限無料APIではありません。価格表とbalance rulesがあります。Web/app、open weights、hosted API は別の利用ルートです。
まずどちらを使うべきですか?
通常は deepseek-v4-flash から始めます。実タスクで差が出たときだけ deepseek-v4-pro を使います。
deepseek-chat は残してよいですか?
短期的には動きますが、aliasです。新規コードは明示的なV4モデルIDを使うべきです。
切り替え後に見るべき指標は?
モデルID、balance、cache behavior、latency、output cost、HTTP 429 を監視します。
