DeepSeek lanza modelos de IA que desafían a GPT-5 y Gemini, y los ofrece de forma gratuita

La empresa china de inteligencia artificial DeepSeek ha sacudido el tablero global con el lanzamiento de dos nuevos modelos que, según sus creadores, igualan o superan las capacidades de GPT-5 de OpenAI y Gemini 3.0 Pro de Google. Los modelos DeepSeek-V3.2 y DeepSeek-V3.2-Speciale han sido presentados como sistemas de razonamiento de vanguardia y han logrado resultados sobresalientes en competencias internacionales de matemáticas, informática y programación.

Ambos modelos han sido liberados bajo una licencia MIT, lo que implica que cualquier desarrollador o empresa puede descargarlos, modificarlos y usarlos sin restricciones. Este movimiento pone en jaque el modelo de negocio basado en APIs pagas de las grandes tecnológicas, al ofrecer un rendimiento comparable de forma completamente gratuita. Continúa leyendo «DeepSeek lanza modelos de IA que desafían a GPT-5 y Gemini, y los ofrece de forma gratuita»

DeepSeek-OCR: una nueva forma de comprimir texto a través de imágenes

Cuando pensamos en inteligencia artificial y lenguaje, lo primero que nos viene a la mente es texto plano, líneas de palabras que una máquina debe leer y procesar. Pero, ¿y si esa no fuera la manera más eficiente de hacerlo? Esa es la premisa detras de DeepSeek-OCR, un modelo de código abierto desarrollado por la firma china DeepSeek que ha desafiado los cánones tradicionales del procesamiento de lenguaje natural.

En lugar de leer texto como secuencias lineales de tokens, DeepSeek-OCR convierte el texto en imágenes y lo procesa visualmente. Esta estrategia, llamada «compresión óptica de contexto», permite reducir la cantidad de datos que una IA necesita para entender documentos extensos. La idea central es que, al ver el texto como una imagen, se puede comprimir su contenido hasta diez veces, sin perder información crucial. Continúa leyendo «DeepSeek-OCR: una nueva forma de comprimir texto a través de imágenes»

DeepSeek reduce un 75% el coste de inferencia con su nuevo modelo de IA

La startup china DeepSeek AI vuelve a dar que hablar con su nuevo modelo DeepSeek-V3.2-Exp, que promete reducir drásticamente los costos de inferencia en modelos de inteligencia artificial generativa. Según su propio blog corporativo, la nueva versión disminuye el coste por millón de tokens de 1,68 dólares a tan solo 42 centavos, lo que representa una caída del 75% en el consumo computacional necesario para generar predicciones.

Esta mejora no se basa en una revolución técnica radical, sino en una optimización continua de un principio conocido desde hace tiempo en el ámbito de la inteligencia artificial: la esparsidad. En términos sencillos, se trata de usar solo las partes más relevantes del modelo y los datos para hacer predicciones, dejando inactivos los componentes que no aportan valor directo a una tarea específica. Continúa leyendo «DeepSeek reduce un 75% el coste de inferencia con su nuevo modelo de IA»

DeepSeek presenta modelo con atención dispersa para reducir a la mitad los costos de inferencia

La compañía china DeepSeek ha lanzado un modelo experimental llamado V3.2-exp, orientado a optimizar el rendimiento de operaciones en contextos largos, uno de los grandes desafíos técnicos en los modelos de lenguaje actuales. Esta versión introduce un sistema innovador llamado DeepSeek Sparse Attention, cuyo objetivo es minimizar la carga computacional y, con ello, reducir significativamente los costos de inferencia.

Cuando hablamos de inferencia, nos referimos al proceso por el cual un modelo ya entrenado genera resultados en base a una entrada dada. Este proceso, aunque menos costoso que el entrenamiento inicial, representa un gasto constante para quienes operan modelos en la nube o a través de API. Por eso, cualquier avance que reduzca el consumo de recursos en esta etapa tiene implicaciones económicas directas. Continúa leyendo «DeepSeek presenta modelo con atención dispersa para reducir a la mitad los costos de inferencia»

La IA que aprende a razonar por su cuenta: el caso de DeepSeek-R1

La inteligencia artificial ha recorrido un largo camino desde los modelos basados en reglas hasta los sistemas actuales capaces de generar texto, programar y resolver problemas complejos. Sin embargo, uno de los mayores retos pendientes ha sido enseñar a las máquinas a razonar, es decir, a pensar paso a paso para llegar a una solución, como lo haría una persona. Ahora, un avance publicado en la revista Nature marca un punto de inflexión en ese camino: el modelo DeepSeek-R1, desarrollado por la empresa china DeepSeek AI, ha demostrado que es posible que una IA aprenda a razonar sin necesidad de intervención humana directa. Continúa leyendo «La IA que aprende a razonar por su cuenta: el caso de DeepSeek-R1»

DeepSeek R2: El fallido intento de China por sustituir a Nvidia con chips de Huawei

La carrera por la inteligencia artificial en China ha tenido un giro inesperado con la retrasada llegada del modelo DeepSeek R2, cuyo desarrollo se vio afectado por la decisión de sustituir hardware de Nvidia por chips Ascend de Huawei. Lo que inicialmente parecía una apuesta estratégica para reforzar la autosuficiencia tecnológica del país, terminó exponiendo las dificultades actuales de las alternativas domésticas frente a las soluciones consolidadas de empresas estadounidenses. Continúa leyendo «DeepSeek R2: El fallido intento de China por sustituir a Nvidia con chips de Huawei»

DeepSeek y las sospechas sobre el uso de datos de Gemini: lo que sabemos hasta ahora

La empresa china DeepSeek ha dado que hablar en el mundo de la inteligencia artificial tras lanzar su modelo R1-0528, una actualización del modelo de razonamiento R1. Este modelo ha destacado por su capacidad para resolver problemas matemáticos y de programación, mostrando resultados competitivos en pruebas especializadas.

Sin embargo, el origen de los datos usados para entrenar este modelo está generando controversia. Continúa leyendo «DeepSeek y las sospechas sobre el uso de datos de Gemini: lo que sabemos hasta ahora»

DeepSeek presenta su modelo R1 reducido: potencia de razonamiento en una sola GPU

La carrera por crear modelos de inteligencia artificial cada vez más poderosos suele ir acompañada de una creciente demanda de recursos computacionales. Pero DeepSeek, un laboratorio de IA con sede en China, está apostando por una estrategia distinta: reducir el tamaño de sus modelos sin comprometer demasiado el rendimiento. Su último lanzamiento, DeepSeek-R1-0528-Qwen3-8B, representa un interesante equilibrio entre eficiencia y capacidad de razonamiento, capaz de funcionar con una única GPU. Continúa leyendo «DeepSeek presenta su modelo R1 reducido: potencia de razonamiento en una sola GPU»

DeepSeek Prover V2: la inteligencia artificial que resuelve teoremas con miles de cerebros expertos

La inteligencia artificial sigue abriéndose camino en territorios tradicionalmente dominados por el razonamiento humano, como las matemáticas avanzadas. Uno de los proyectos más ambiciosos en este ámbito es DeepSeek Prover, un modelo de IA desarrollado por el laboratorio chino DeepSeek, que acaba de recibir una importante actualización. Esta nueva versión, Prover V2, está diseñada específicamente para enfrentar problemas matemáticos complejos, como demostraciones formales y razonamientos lógicos, y promete dar un gran salto en precisión y eficiencia.

Vamos a desglosar qué hace especial a esta herramienta, cuál es su base tecnológica y por qué podría convertirse en un aliado clave para matemáticos, ingenieros y científicos.
Continúa leyendo «DeepSeek Prover V2: la inteligencia artificial que resuelve teoremas con miles de cerebros expertos»

DeepSeek R2: El nuevo contendiente en el mundo de la inteligencia artificial

Hace tan solo unos meses, DeepSeek sacudió los cimientos del mundo tecnológico. Esta compañía china presentó DeepSeek R1, un modelo de razonamiento en inteligencia artificial que, pese a utilizar menos recursos y hardware menos potente, logró equipararse a gigantes como ChatGPT-4. Para muchos, fue como ver a un pequeño barco enfrentarse a un transatlántico y mantenerse a flote. Continúa leyendo «DeepSeek R2: El nuevo contendiente en el mundo de la inteligencia artificial»