Categoría

Categoría: Deepseek

44 artículos
deepseek

DeepSeek presenta mHC: la ingeniería (y la matemática) para entrenar LLM con menos fricción

Cuando hablamos de modelos de lenguaje cada vez más capaces, casi siempre miramos el resultado final: un chatbot que razona mejor, un generador de código más fino, un asistente que entiende contexto largo. DeepSeek ha puesto el foco en otra parte del iceberg: el proceso de entrenamiento. Su propuesta, mHC (siglas de Manifold-Constrained Hyper-Connections), se… <a href="https://wwwhatsnew.com/2026/01/05/deepseek-presenta-mhc-la-ingenieria-y-la-matematica-para-entrenar-llm-con-menos-friccion/">Continúa leyendo »</a>

DeepSeek lanza modelos de IA que desafían a GPT-5 y Gemini, y los ofrece de forma gratuita

La empresa china de inteligencia artificial DeepSeek ha sacudido el tablero global con el lanzamiento de dos nuevos modelos que, según sus creadores, igualan o superan las capacidades de GPT-5 de OpenAI y Gemini 3.0 Pro de Google. Los modelos DeepSeek-V3.2 y DeepSeek-V3.2-Speciale han sido presentados como sistemas de razonamiento de vanguardia y han logrado… <a href="https://wwwhatsnew.com/2025/12/03/deepseek-lanza-modelos-de-ia-que-desafian-a-gpt-5-y-gemini-y-los-ofrece-de-forma-gratuita/">Continúa leyendo »</a>

Ilustración conceptual de DeepSeek AI y ChatGPT como entidades futuristas de inteligencia artificial, representando sus diferencias en enfoque y tecnología.

DeepSeek-OCR: una nueva forma de comprimir texto a través de imágenes

Cuando pensamos en inteligencia artificial y lenguaje, lo primero que nos viene a la mente es texto plano, líneas de palabras que una máquina debe leer y procesar. Pero, ¿y si esa no fuera la manera más eficiente de hacerlo? Esa es la premisa detras de DeepSeek-OCR, un modelo de código abierto desarrollado por la… <a href="https://wwwhatsnew.com/2025/10/22/deepseek-ocr-una-nueva-forma-de-comprimir-texto-a-traves-de-imagenes/">Continúa leyendo »</a>

DeepSeek-OCR

DeepSeek reduce un 75% el coste de inferencia con su nuevo modelo de IA

La startup china DeepSeek AI vuelve a dar que hablar con su nuevo modelo DeepSeek-V3.2-Exp, que promete reducir drásticamente los costos de inferencia en modelos de inteligencia artificial generativa. Según su propio blog corporativo, la nueva versión disminuye el coste por millón de tokens de 1,68 dólares a tan solo 42 centavos, lo que representa… <a href="https://wwwhatsnew.com/2025/10/09/deepseek-reduce-un-75-el-coste-de-inferencia-con-su-nuevo-modelo-de-ia/">Continúa leyendo »</a>

DeepSeek reduce un 75% el coste de inferencia

DeepSeek presenta modelo con atención dispersa para reducir a la mitad los costos de inferencia

La compañía china DeepSeek ha lanzado un modelo experimental llamado V3.2-exp, orientado a optimizar el rendimiento de operaciones en contextos largos, uno de los grandes desafíos técnicos en los modelos de lenguaje actuales. Esta versión introduce un sistema innovador llamado DeepSeek Sparse Attention, cuyo objetivo es minimizar la carga computacional y, con ello, reducir significativamente… <a href="https://wwwhatsnew.com/2025/10/01/deepseek-presenta-modelo-con-atencion-dispersa-para-reducir-a-la-mitad-los-costos-de-inferencia/">Continúa leyendo »</a>

modelo con atención dispersa

La IA que aprende a razonar por su cuenta: el caso de DeepSeek-R1

La inteligencia artificial ha recorrido un largo camino desde los modelos basados en reglas hasta los sistemas actuales capaces de generar texto, programar y resolver problemas complejos. Sin embargo, uno de los mayores retos pendientes ha sido enseñar a las máquinas a razonar, es decir, a pensar paso a paso para llegar a una solución,… <a href="https://wwwhatsnew.com/2025/09/23/la-ia-que-aprende-a-razonar-por-su-cuenta-el-caso-de-deepseek-r1/">Continúa leyendo »</a>

ai_autodidacta_compressed

DeepSeek R2: El fallido intento de China por sustituir a Nvidia con chips de Huawei

La carrera por la inteligencia artificial en China ha tenido un giro inesperado con la retrasada llegada del modelo DeepSeek R2, cuyo desarrollo se vio afectado por la decisión de sustituir hardware de Nvidia por chips Ascend de Huawei. Lo que inicialmente parecía una apuesta estratégica para reforzar la autosuficiencia tecnológica del país, terminó exponiendo… <a href="https://wwwhatsnew.com/2025/08/16/deepseek-r2-el-fallido-intento-de-china-por-sustituir-a-nvidia-con-chips-de-huawei/">Continúa leyendo »</a>

retrasada llegada del modelo DeepSeek R2

DeepSeek y las sospechas sobre el uso de datos de Gemini: lo que sabemos hasta ahora

La empresa china DeepSeek ha dado que hablar en el mundo de la inteligencia artificial tras lanzar su modelo R1-0528, una actualización del modelo de razonamiento R1. Este modelo ha destacado por su capacidad para resolver problemas matemáticos y de programación, mostrando resultados competitivos en pruebas especializadas. Sin embargo, el origen de los datos usados… <a href="https://wwwhatsnew.com/2025/06/04/deepseek-y-las-sospechas-sobre-el-uso-de-datos-de-gemini-lo-que-sabemos-hasta-ahora/">Continúa leyendo »</a>

Una figura encapuchada frente a un ordenador portátil, observada por dos robots naranjas en un entorno lleno de símbolos atómicos y formas geométricas (1)

DeepSeek presenta su modelo R1 reducido: potencia de razonamiento en una sola GPU

La carrera por crear modelos de inteligencia artificial cada vez más poderosos suele ir acompañada de una creciente demanda de recursos computacionales. Pero DeepSeek, un laboratorio de IA con sede en China, está apostando por una estrategia distinta: reducir el tamaño de sus modelos sin comprometer demasiado el rendimiento. Su último lanzamiento, DeepSeek-R1-0528-Qwen3-8B, representa un… <a href="https://wwwhatsnew.com/2025/05/30/deepseek-presenta-su-modelo-r1-reducido-potencia-de-razonamiento-en-una-sola-gpu/">Continúa leyendo »</a>

ilustración surrealista de inteligencia artificial destilada con silueta humana y procesador

DeepSeek Prover V2: la inteligencia artificial que resuelve teoremas con miles de cerebros expertos

La inteligencia artificial sigue abriéndose camino en territorios tradicionalmente dominados por el razonamiento humano, como las matemáticas avanzadas. Uno de los proyectos más ambiciosos en este ámbito es DeepSeek Prover, un modelo de IA desarrollado por el laboratorio chino DeepSeek, que acaba de recibir una importante actualización. Esta nueva versión, Prover V2, está diseñada específicamente… <a href="https://wwwhatsnew.com/2025/05/02/deepseek-prover-v2-la-inteligencia-artificial-que-resuelve-teoremas-con-miles-de-cerebros-expertos/">Continúa leyendo »</a>

Ilustración surrealista de inteligencia artificial resolviendo problemas matemáticos complejos en un paisaje onírico