Categoría

Categoría: Deepseek

46 artículos
smartphone con interfaz de la app DeepSeek AI y fondo con ilustración de red neuronal digital

DeepSeek V4 llega con seis meses de retraso, sin multimodalidad y reconociendo que va detrás del estado del arte: el héroe chino tiene pies de barro

DeepSeek ha publicado este 29 de abril su modelo V4 bajo licencia MIT, con mejoras notables en código y arquitectura diseñada para chips chinos. Lo cubre Javier Lacort en Xataka. La compañía también ha admitido, en su propio informe técnico, que va de tres a seis meses por detrás de los modelos occidentales punteros. Para… <a href="https://wwwhatsnew.com/2026/04/30/deepseek-v4-retraso-multimodalidad-pies-barro-abril-2026/">Continúa leyendo »</a>

DeepSeek V4 Pro: 1,6 billones de parámetros, el open-weight más grande del mundo y precios que aprietan de nuevo al frontier americano

DeepSeek ha lanzado este 24 de abril la preview de DeepSeek V4, con dos variantes: V4 Flash (284.000 millones de parámetros, 13.000 millones activos) y V4 Pro (1,6 billones de parámetros, 49.000 millones activos). Ambos son modelos Mixture-of-Experts con ventana de contexto de 1 millón de tokens. Ram Iyer lo cubre en TechCrunch. La cifra… <a href="https://wwwhatsnew.com/2026/04/26/deepseek-v4-pro-flash-modelo-open-weight-precio-abril-2026/">Continúa leyendo »</a>

Herramienta DeepSeek OCR extrayendo texto e información de documentos mediante reconocimiento óptico de caracteres con IA

DeepSeek presenta mHC: la ingeniería (y la matemática) para entrenar LLM con menos fricción

Cuando hablamos de modelos de lenguaje cada vez más capaces, casi siempre miramos el resultado final: un chatbot que razona mejor, un generador de código más fino, un asistente que entiende contexto largo. DeepSeek ha puesto el foco en otra parte del iceberg: el proceso de entrenamiento. Su propuesta, mHC (siglas de Manifold-Constrained Hyper-Connections), se… <a href="https://wwwhatsnew.com/2026/01/05/deepseek-presenta-mhc-la-ingenieria-y-la-matematica-para-entrenar-llm-con-menos-friccion/">Continúa leyendo »</a>

Interfaz del modelo de inteligencia artificial DeepSeek, empresa china que presenta MHC para entrenar grandes modelos de lenguaje con menor fricción matemática y mayor eficiencia

DeepSeek-OCR: una nueva forma de comprimir texto a través de imágenes

Cuando pensamos en inteligencia artificial y lenguaje, lo primero que nos viene a la mente es texto plano, líneas de palabras que una máquina debe leer y procesar. Pero, ¿y si esa no fuera la manera más eficiente de hacerlo? Esa es la premisa detras de DeepSeek-OCR, un modelo de código abierto desarrollado por la… <a href="https://wwwhatsnew.com/2025/10/22/deepseek-ocr-una-nueva-forma-de-comprimir-texto-a-traves-de-imagenes/">Continúa leyendo »</a>

Herramienta DeepSeek OCR extrayendo texto e información de documentos mediante reconocimiento óptico de caracteres con IA

DeepSeek reduce un 75% el coste de inferencia con su nuevo modelo de IA

La startup china DeepSeek AI vuelve a dar que hablar con su nuevo modelo DeepSeek-V3.2-Exp, que promete reducir drásticamente los costos de inferencia en modelos de inteligencia artificial generativa. Según su propio blog corporativo, la nueva versión disminuye el coste por millón de tokens de 1,68 dólares a tan solo 42 centavos, lo que representa… <a href="https://wwwhatsnew.com/2025/10/09/deepseek-reduce-un-75-el-coste-de-inferencia-con-su-nuevo-modelo-de-ia/">Continúa leyendo »</a>

Comparativa de costes de inferencia mostrando la reducción del 75 por ciento lograda por el nuevo modelo DeepSeek

DeepSeek presenta modelo con atención dispersa para reducir a la mitad los costos de inferencia

La compañía china DeepSeek ha lanzado un modelo experimental llamado V3.2-exp, orientado a optimizar el rendimiento de operaciones en contextos largos, uno de los grandes desafíos técnicos en los modelos de lenguaje actuales. Esta versión introduce un sistema innovador llamado DeepSeek Sparse Attention, cuyo objetivo es minimizar la carga computacional y, con ello, reducir significativamente… <a href="https://wwwhatsnew.com/2025/10/01/deepseek-presenta-modelo-con-atencion-dispersa-para-reducir-a-la-mitad-los-costos-de-inferencia/">Continúa leyendo »</a>

Diagrama del mecanismo de atención dispersa de DeepSeek que optimiza la inferencia reduciendo costes computacionales

La IA que aprende a razonar por su cuenta: el caso de DeepSeek-R1

La inteligencia artificial ha recorrido un largo camino desde los modelos basados en reglas hasta los sistemas actuales capaces de generar texto, programar y resolver problemas complejos. Sin embargo, uno de los mayores retos pendientes ha sido enseñar a las máquinas a razonar, es decir, a pensar paso a paso para llegar a una solución,… <a href="https://wwwhatsnew.com/2025/09/23/la-ia-que-aprende-a-razonar-por-su-cuenta-el-caso-de-deepseek-r1/">Continúa leyendo »</a>

IA autodidacta aprendizaje autónomo sin datos entrenamiento modelo auto-supervisado

DeepSeek R2: El fallido intento de China por sustituir a Nvidia con chips de Huawei

La carrera por la inteligencia artificial en China ha tenido un giro inesperado con la retrasada llegada del modelo DeepSeek R2, cuyo desarrollo se vio afectado por la decisión de sustituir hardware de Nvidia por chips Ascend de Huawei. Lo que inicialmente parecía una apuesta estratégica para reforzar la autosuficiencia tecnológica del país, terminó exponiendo… <a href="https://wwwhatsnew.com/2025/08/16/deepseek-r2-el-fallido-intento-de-china-por-sustituir-a-nvidia-con-chips-de-huawei/">Continúa leyendo »</a>

retrasada llegada del modelo DeepSeek R2

DeepSeek y las sospechas sobre el uso de datos de Gemini: lo que sabemos hasta ahora

La empresa china DeepSeek ha dado que hablar en el mundo de la inteligencia artificial tras lanzar su modelo R1-0528, una actualización del modelo de razonamiento R1. Este modelo ha destacado por su capacidad para resolver problemas matemáticos y de programación, mostrando resultados competitivos en pruebas especializadas. Sin embargo, el origen de los datos usados… <a href="https://wwwhatsnew.com/2025/06/04/deepseek-y-las-sospechas-sobre-el-uso-de-datos-de-gemini-lo-que-sabemos-hasta-ahora/">Continúa leyendo »</a>

Una figura encapuchada frente a un ordenador portátil, observada por dos robots naranjas en un entorno lleno de símbolos atómicos y formas geométricas (1)