DeepSeek hace permanente el descuento del 75% en su modelo V4-Pro: ahora cuesta lo mismo que costaba el mes pasado, para siempre

DeepSeek anunció el 22 de mayo de 2026 que el descuento del 75% que había aplicado como promoción temporal sobre su modelo estrella DeepSeek V4-Pro se convierte en el precio definitivo y permanente. La promoción estaba fijada para expirar el 31 de mayo. No expirará. Los precios actuales del API de V4-Pro —entre $0,003625 y $0,87 por millón de tokens— son los nuevos precios estándar, sin fecha de caducidad.

La decisión se anunció en un comunicado en la web de DeepSeek, recogido el mismo día por Reuters y Bloomberg. La compañía no dio explicaciones detalladas sobre los motivos, aunque el contexto lo hace bastante legible: la presión competitiva de los modelos occidentales, la base de usuarios empresariales que había adoptado la plataforma durante el período de descuento, y la estrategia de crecimiento a largo plazo a costa de márgenes en el corto plazo.

Los números del descuento y qué significan en la práctica

El precio original del API de DeepSeek V4-Pro antes del descuento era de $0,0145 a $3,48 por millón de tokens según el tipo de operación. El precio con el descuento del 75%, ahora permanente, es de $0,003625 a $0,87 por millón de tokens. En yuan, el rango pasa de 0,1-24 yuan a 0,025-6 yuan por millón de tokens.

Hay un segundo movimiento que pasó más desapercibido pero que para desarrolladores es igual de relevante: DeepSeek también hizo permanente una reducción del 90% en el precio de los input cache hits en toda su API. Un cache hit es cuando el modelo ha visto previamente una sección del contexto —por ejemplo, el mismo system prompt enviado al comienzo de cada petición— y no necesita procesarlo de nuevo. En aplicaciones con system prompts largos, múltiples turnos de conversación o pipelines agentes que reutilizan el mismo contexto, los cache hits se acumulan. Al precio de $0,003625 por millón de tokens en cache, las iteraciones en software de producción se vuelven prácticamente gratuitas para ciclos repetitivos.

Para comparar con los competidores directos: ejecutar tareas equivalentes en los modelos frontera de OpenAI o en las variantes top de Claude puede costar entre 8 y 35 veces más que con DeepSeek V4-Pro. En proyectos con alto volumen de tokens —análisis de documentos, pipelines de agentes, RAG sobre bases de datos extensas— esa diferencia de precio es transformadora.

El contexto: DeepSeek V4-Pro como modelo

DeepSeek V4-Pro se lanzó el 24 de abril de 2026 junto con una variante más ligera, V4 Flash. El modelo fue presentado por DeepSeek como la inauguración de «la era de los 1M de tokens de contexto a precio asequible». Con una ventana de contexto de 1 millón de tokens (equivalente a varios libros de texto o a decenas de miles de líneas de código), V4-Pro compite directamente con Gemini 1.5 Pro y con las variantes extendidas de contexto de GPT-5 y Claude Opus 4.

En benchmarks públicos, V4-Pro alcanza un 80,6% en SWE-bench Verified —el estándar de referencia para capacidades de programación autónoma—, una cifra comparable o superior a Claude Opus 4.7 y GPT-5.5 en las mismas pruebas. La diferencia no está en la calidad sino en el precio: V4-Pro lo hace a aproximadamente un trigésimo del coste por token de los modelos occidentales equivalentes.

DeepSeek-V3: el modelo de IA chino que prometía desafiar a los gigantes fue la primera señal seria de que la startup de Hangzhou podía competir a nivel técnico con OpenAI y Google. DeepSeek reducía un 75% el coste de inferencia con su modelo V3.2-Exp en octubre de 2025, que es exactamente el mismo porcentaje que ahora aplica permanentemente a V4-Pro —una señal de que el patrón de reducción agresiva de precios es parte de la estrategia y no un accidente. DeepSeek-R1 fue la revolución open-source que obligó a todos a repensar el coste real de la IA en enero de 2025: V4-Pro es la continuación lógica de esa trayectoria.

La variable que DeepSeek no controla: los chips de Huawei

DeepSeek V4-Pro corre sobre chips Huawei Ascend 950, no sobre GPUs NVIDIA. Las restricciones de exportación de semiconductores avanzados impuestas por el gobierno de Estados Unidos impiden que DeepSeek acceda a los chips H100 y A100 de NVIDIA que usan OpenAI y Anthropic. El hecho de que V4-Pro haya alcanzado su nivel de rendimiento con hardware restringido es parte del logro técnico que celebra la empresa —y parte del argumento geopolítico que tiene detrás.

La propia DeepSeek había comunicado en el lanzamiento de V4 que los precios del modelo Pro «disminuirán significativamente» cuando se despliegue masivamente el chip Ascend 950 en la segunda mitad de 2026. El descuento permanente del 22 de mayo podría ser la anticipación de esa bajada, o podría ser una respuesta a la frustración creciente de desarrolladores con los límites de uso de los modelos occidentales. Probablemente sea las dos cosas.

Mi valoración

Llevo siguiendo la evolución de costes de los modelos de lenguaje desde que GPT-3 costaba fracciones de dólar por mil tokens y parecía barato. La commoditización del LLM era predecible, pero el ritmo al que DeepSeek la está ejecutando es más rápido de lo que nadie esperaba hace dos años.

Lo que más me convence de este movimiento: hacer permanente un descuento que expiraba en nueve días no es una decisión de marketing —es un ajuste de modelo de negocio. DeepSeek está eligiendo la penetración masiva de mercado sobre la rentabilidad a corto plazo. Eso tiene sentido si confías en que escalar usuarios hoy construye la posición de plataforma que necesitas para monetizar después, como hicieron Google con Search y Amazon con AWS.

Lo que más me preocupa: el diferencial de precio entre DeepSeek V4-Pro y los modelos occidentales equivalentes es tan extremo que empieza a generar una dependencia que podría convertirse en vulnerabilidad geopolítica. Si DeepSeek sube precios en 18 meses —cuando los usuarios hayan reescrito sus pipelines en torno a su API— las alternativas occidentales a ese precio simplemente no existen todavía.

Preguntas frecuentes

¿En qué se diferencia DeepSeek V4-Pro de V4 Flash?

V4-Pro es la variante más potente y de mayor contexto (1M tokens), con mejores resultados en benchmarks de razonamiento complejo y programación. V4 Flash es la variante más ligera y económica, diseñada para tareas de menor complejidad que no requieren todo el potencial del modelo Pro. El precio de Flash es inferior al de Pro incluso con el descuento aplicado.

¿Puedo usar DeepSeek V4-Pro en mis propias aplicaciones?

Sí. DeepSeek ofrece acceso API estándar a través de su web (api.deepseek.com), también disponible vía OpenRouter y otras plataformas de agregación de modelos. La documentación cubre los parámetros estándar de los modelos de lenguaje y es compatible con los flujos de trabajo habituales de desarrollo. Los nuevos precios permanentes están disponibles inmediatamente.

¿Dónde está el truco? ¿Por qué tan barato?

DeepSeek es una startup china propiedad del hedge fund High-Flyer, que no necesita generar caja inmediata de su división de IA. Su estrategia declarada es escalar usuario primero. A diferencia de OpenAI o Anthropic, que tienen quemaderos de efectivo en computación y tienen que monetizar para sobrevivir, DeepSeek puede subsidiar los precios durante más tiempo. Las restricciones al hardware occidental también le han obligado a optimizar su software más agresivamente, reduciendo el coste computacional por token.