DeepSeek V4: que cambia para usar la API tras el preview

•24 abr 2026•6 min de lectura•AI API Guides

DeepSeek V4 ya no es solo un rumor. El preview del 24 de abril de 2026 expone deepseek-v4-flash y deepseek-v4-pro en la API, con alias antiguos que dejan de ser seguros tras el 24 de julio.

Mapa de DeepSeek V4 API con Flash, Pro, alias antiguos, limite de precio y fecha de migracion

DeepSeek V4 Preview esta disponible desde el 24 de abril de 2026. Para usuarios de API, el cambio importante es concreto: los model IDs oficiales son deepseek-v4-flash y deepseek-v4-pro. Los antiguos deepseek-chat y deepseek-reasoner ahora son aliases temporales hacia modos de V4 Flash, y DeepSeek indica que dejaran de estar disponibles despues del 24 de julio de 2026 a las 15:59 UTC.

La primera pregunta no deberia ser si V4 es "gratis". Web y app sirven para probar, y los open weights abren una ruta local. Pero la API oficial hospedada sigue siendo un contrato de tokens con precios y balance. Empieza con Flash, y usa Pro solo cuando tu carga real demuestre que la mejora compensa el coste.

Que cambia con el preview de V4

V4 ya no es una especulacion. DeepSeek describe V4 Pro con 1.6T total parameters y 49B active parameters, y V4 Flash con 284B total parameters y 13B active parameters. La empresa tambien presenta 1M context como capacidad estandar en sus servicios oficiales.

Eso cambia la lectura de las paginas antiguas. Antes el problema era confirmar si V4 existia. Ahora el trabajo del desarrollador es revisar model list, pricing, balance, rate limit y la fecha de retirada de aliases.

Elige Flash o Pro antes de cambiar codigo

Mapa de rutas DeepSeek V4

Eleccion	Usala cuando	Limite
`deepseek-v4-flash`	Necesitas la ruta por defecto, menor coste, menor latencia o pruebas de produccion.	No es una API hospedada gratis e ilimitada.
`deepseek-v4-pro`	Necesitas razonamiento dificil, agentic coding o mejor calidad comprobada.	Cuesta bastante mas, asi que mide el valor.
`deepseek-chat`	Mantienes una integracion antigua durante poco tiempo.	Alias a V4 Flash non-thinking, no ID a largo plazo.
`deepseek-reasoner`	Mantienes razonamiento antiguo durante poco tiempo.	Alias a V4 Flash thinking, con la misma fecha de retirada.

El codigo nuevo deberia fijar el ID explicito de V4. El codigo antiguo necesita una tarea de migracion para quitar aliases.

Que revisar en el contrato API

Contrato DeepSeek V4 API

La base URL en formato OpenAI es https://api.deepseek.com; el formato Anthropic usa https://api.deepseek.com/anthropic. Ambos modelos V4 indican 1M context y 384K max output.

El precio no es solo "barato". Flash aparece con $0.028 cache-hit input, $0.14 cache-miss input y $0.28 output por 1M tokens. Pro aparece con $0.145, $1.74 y $3.48. Como los precios pueden cambiar, la documentacion de produccion debe enlazar la pagina oficial.

El balance endpoint separa total, granted y topped-up balance. El rate limit es dinamico; cuando llegas al limite recibes HTTP 429. El cliente debe tener backoff, retry y mensajes claros para usuarios.

Checklist de migracion

Checklist de migracion DeepSeek V4

Busca deepseek-chat y deepseek-reasoner en el codigo.
Decide que llamadas van a Flash y cuales a Pro.
Prueba thinking y non-thinking de forma explicita.
Verifica /models en el entorno de despliegue.
Consulta /user/balance solo desde servidor.
Maneja 429 con backoff y retry.
Quita los aliases antes de la ventana de julio de 2026.

Si ves "DeepSeek V4 free API", separa si habla de API oficial, creditos de un wrapper, open weights locales o una solucion con sesion web. Son rutas distintas.

La primera prueba debe ser pequeña y repetible. Ejecuta Flash con un prompt corto, un contexto largo y una tarea con herramientas; registra latency, output tokens, 429, cambio de balance y calidad. Despues ejecuta Pro con el mismo set. Solo merece ser ruta por defecto si la mejora aparece en tus criterios de aceptacion, no solo en la conversacion del dia de lanzamiento.

Como evaluar V4 sin prometer demasiado

DeepSeek V4 Flash y Pro

Flash deberia ser la ruta inicial porque es economica y suficiente para la mayoria de pruebas. Pro tiene sentido en razonamiento dificil, agentic coding y tareas con alto coste de error, pero solo despues de probarlo con tu workload.

Una buena evaluacion tiene tres columnas: tipo de tarea, quality delta y cost delta. Si Flash pasa tus acceptance tests, sigue siendo la primera opcion para la mayoria de equipos API.

Preguntas frecuentes

La API de DeepSeek V4 es gratis?

La API oficial hospedada no es una API gratis e ilimitada. Hay precios, balance rules, web/app y open weights, pero son rutas separadas.

Con que modelo empiezo?

Empieza con deepseek-v4-flash. Usa deepseek-v4-pro cuando tu workload pruebe una mejora suficiente.

Puedo mantener deepseek-chat?

Solo como puente corto. El codigo nuevo debe usar model IDs explicitos de V4.

Que debo monitorizar?

Disponibilidad de modelo, balance, cache behavior, latency, output cost y HTTP 429.

#DeepSeek V4#DeepSeek API#AI API#migracion de modelo