DeepSeek V4 Preview는 2026년 4월 24일 공개되었습니다. API 사용자에게 중요한 변화는 명확합니다. 현재 공식 모델 ID는 deepseek-v4-flash와 deepseek-v4-pro이고, 기존 deepseek-chat과 deepseek-reasoner는 V4 Flash의 비사고/사고 모드로 연결되는 임시 alias입니다. DeepSeek는 이 alias가 2026년 7월 24일 15:59 UTC 이후 사용할 수 없다고 안내했습니다.
따라서 첫 질문은 "완전 무료 API인가"가 아닙니다. 웹과 앱은 빠른 테스트에 좋고, open weights는 로컬 경로를 제공합니다. 하지만 공식 hosted API는 token pricing과 balance 규칙을 따르는 계약입니다. 대부분은 Flash로 시작하고, 실제 업무에서 Pro의 품질 이득이 비용을 정당화할 때만 Pro를 선택하면 됩니다.
V4 Preview에서 바뀐 점
V4는 더 이상 루머가 아닙니다. 공식 릴리스는 V4 Pro를 1.6T total parameters / 49B active parameters, V4 Flash를 284B total parameters / 13B active parameters로 설명합니다. 또한 공식 서비스의 1M context를 강조합니다.
이제 개발자가 확인해야 할 것은 모델 존재 여부가 아니라 model list, pricing, balance, rate limit, alias retirement입니다. 예전 비교 글은 배경 자료로만 읽고, 구현은 현재 공식 문서에 맞춰야 합니다.
Flash와 Pro를 먼저 선택하기

| 선택 | 시작하기 좋은 경우 | 경계 |
|---|---|---|
deepseek-v4-flash | 기본 API, 낮은 비용, 빠른 응답, 프로덕션 전 테스트. | 무제한 무료 hosted API가 아니며 가격과 balance 규칙을 따른다. |
deepseek-v4-pro | 어려운 reasoning, agentic coding, 품질 차이가 큰 업무. | 비용이 높으므로 실제 workload에서 가치가 확인되어야 한다. |
deepseek-chat | 오래된 통합을 잠시 유지해야 할 때. | V4 Flash non-thinking alias일 뿐 장기 모델 ID가 아니다. |
deepseek-reasoner | 오래된 reasoning 통합을 잠시 유지할 때. | V4 Flash thinking alias이며 같은 retirement deadline이 있다. |
새 코드는 명시적인 V4 ID를 사용하고, 기존 코드는 alias 제거를 별도 마이그레이션으로 관리해야 합니다.
API 계약에서 확인할 것

OpenAI 형식 base URL은 https://api.deepseek.com이고 Anthropic 형식은 https://api.deepseek.com/anthropic입니다. 두 V4 모델 모두 1M context와 384K max output을 지원한다고 문서에 나와 있습니다.
가격은 단순히 "저렴하다"가 아닙니다. Flash는 1M tokens 기준 cache-hit input $0.028, cache-miss input $0.14, output $0.28입니다. Pro는 각각 $0.145, $1.74, $3.48입니다. 가격은 바뀔 수 있으므로 운영 문서는 공식 가격 페이지를 링크해야 합니다.
Balance endpoint는 total, granted, topped-up balance를 분리합니다. rate limit은 동적이며 제한에 도달하면 HTTP 429가 반환됩니다. 클라이언트는 backoff와 retry를 구현해야 합니다.
alias 마이그레이션 체크리스트

- 코드에서
deepseek-chat과deepseek-reasoner를 찾습니다. - 각 호출을 Flash 또는 Pro로 분류합니다.
- thinking과 non-thinking 동작을 명시적으로 테스트합니다.
- 배포 환경에서
/models를 확인합니다. /user/balance는 서버 쪽에서만 확인합니다.- 429에 대한 backoff와 사용자 메시지를 준비합니다.
- 2026년 7월 24일 전에 alias 의존성을 제거합니다.
"DeepSeek V4 free API"라는 표현을 보면 공식 API인지, 무료 크레딧인지, 로컬 open weights인지, 웹 세션 우회인지 먼저 구분해야 합니다.
첫 번째 테스트는 작고 고정된 세트로 시작하는 것이 좋습니다. Flash로 짧은 프롬프트, 긴 context, tool-heavy 작업을 각각 실행하고 latency, output tokens, 429, balance 변화, 답변 품질을 기록합니다. 같은 조건에서 Pro를 비교한 뒤, 차이가 분명한 작업만 Pro로 올립니다. 이렇게 하면 출시일의 분위기가 아니라 실제 acceptance criteria로 기본 경로를 정할 수 있습니다.
과장하지 않고 V4 평가하기

Flash를 기본 평가 경로로 두는 것이 안전합니다. 비용이 낮고 대부분의 초기 API 테스트에 충분합니다. Pro는 긴 문맥, 어려운 추론, 코드 에이전트 업무에서 검토하되 실제 acceptance tests를 통과했을 때만 기본값으로 올립니다.
평가표에는 task family, quality delta, cost delta를 함께 기록해야 합니다. Flash가 조건을 만족하면 API 팀의 첫 선택은 여전히 Flash입니다.
자주 묻는 질문
DeepSeek V4 API는 무료인가요?
공식 hosted API는 무제한 무료 API가 아닙니다. 가격표와 balance rules가 있습니다. 웹/앱, open weights, hosted API는 서로 다른 경로입니다.
어떤 모델로 시작해야 하나요?
대부분은 deepseek-v4-flash로 시작합니다. 실제 업무에서 Pro의 품질 이득이 확인될 때 deepseek-v4-pro를 사용합니다.
deepseek-chat을 계속 써도 되나요?
짧은 기간에는 가능하지만 alias입니다. 새 코드는 명시적인 V4 model ID를 사용해야 합니다.
전환 후 무엇을 모니터링하나요?
model availability, balance, cache behavior, latency, output cost, HTTP 429를 확인합니다.
