DeepSeek-R1: La nueva revolución de la IA open-source que desafía a los gigantes

Juan Diego Polo

hace 2 meses

Publicidad en la inteligencia artificial

La tecnología de inteligencia artificial sigue avanzando a pasos agigantados, y esta vez, el protagonista del momento es DeepSeek-R1, un modelo de razón open-source que está dando mucho de qué hablar. DeepSeek, una startup china conocida por desafiar a grandes empresas de IA con soluciones de código abierto, ha presentado esta nueva joya, capaz de igualar el rendimiento del modelo o1 de OpenAI en tareas complejas de matemáticas, programación y razonamiento, pero con un coste entre un 90% y 95% menor.

Desde wwwhatsnew.com, creemos que este lanzamiento marca un gran avance para la inteligencia artificial de código abierto y pone en evidencia cómo estas iniciativas están cerrando la brecha con los modelos comerciales cerrados en la carrera hacia la inteligencia general artificial (AGI).

Un modelo que redefine el razonamiento en la IA

El objetivo de muchos desarrolladores de IA es alcanzar la inteligencia general artificial (AGI), donde las máquinas puedan realizar tareas intelectuales al nivel de un humano. En este contexto, OpenAI ha liderado el camino con su modelo o1, que utiliza un enfoque de razonamiento en cadena de pensamiento (chain-of-thought). Este enfoque permite al modelo dividir un problema en pasos lógicos y, mediante aprendizaje por refuerzo (RL, por sus siglas en inglés), optimizar sus estrategias y corregir errores.

Ahora, DeepSeek-R1 ha llevado esta idea al siguiente nivel. Este modelo combina aprendizaje por refuerzo y ajustes supervisados para abordar tareas complejas de razonamiento. En pruebas realizadas, DeepSeek-R1 ha demostrado un rendimiento impresionante:

79,8% en los exámenes de matemáticas AIME 2024.
97,3% en el conjunto de datos MATH-500.
Un puntaje de 2.029 en Codeforces, superando al 96,3% de los programadores humanos.

En comparación, el modelo o1-1217 de OpenAI logró un 79,2%, 96,4% y 96,6% respectivamente en estas pruebas. Aunque las diferencias son pequeñas, el rendimiento de DeepSeek-R1 resulta asombroso considerando su carácter open-source y su menor coste.

El entrenamiento que lo hizo posible

Detrás del éxito de DeepSeek-R1 hay un proceso de desarrollo fascinante. Todo comenzó con una versión inicial llamada DeepSeek-R1-Zero, diseñada exclusivamente con aprendizaje por refuerzo. Este modelo fue entrenado sin datos supervisados, confiando únicamente en su capacidad de evolución propia mediante prueba y error.

Los investigadores notaron comportamientos de razonamiento avanzados emergentes en DeepSeek-R1-Zero, como la reflexión y la exploración de alternativas. Sin embargo, el modelo inicial tenía problemas de legibilidad y una mezcla de idiomas en sus respuestas.

Para superar estas limitaciones, DeepSeek adoptó un enfoque de varias etapas:

Recolección de datos iniciales: Se utilizó el modelo base DeepSeek-V3 para recopilar datos que ayudaran a entrenar el modelo.
Aprendizaje supervisado: Estos datos se usaron para ajustar el modelo inicial.
Reforzamiento avanzado: A partir de los datos ajustados, se implementó un proceso de refuerzo orientado al razonamiento.
Reentrenamiento con nuevos datos: Mediante un enfoque de muestreo por rechazo, se generaron nuevos datos supervisados para afinar el modelo.
Procesos iterativos: Se repitieron ciclos de aprendizaje supervisado y por refuerzo hasta alcanzar un rendimiento comparable al de o1 de OpenAI.

El resultado fue DeepSeek-R1, un modelo que no solo iguala a los líderes del mercado, sino que también ofrece una alternativa mucho más asequible.

Una opción mucho más económica

El coste es una de las características más destacadas de DeepSeek-R1. Mientras que el modelo o1 de OpenAI tiene un coste de $15 por millón de tokens de entrada y $60 por millón de tokens de salida, DeepSeek Reasoner, basado en R1, cuesta tan solo $0,55 por millón de tokens de entrada y $2,19 por millón de tokens de salida. ¡Una reducción impresionante!

Esto hace que DeepSeek-R1 sea una opción muy atractiva para desarrolladores, startups y empresas que buscan capacidades avanzadas de IA sin romper el presupuesto. Además, el modelo está disponible bajo una licencia MIT en Hugging Face, lo que significa que cualquiera puede acceder a su código y pesos para probarlo o integrarlo en sus sistemas.

Impacto en la comunidad de IA

La llegada de DeepSeek-R1 también subraya el poder de las iniciativas de código abierto. En wwwhatsnew.com, creemos que este tipo de desarrollos democratizan la IA y permiten a más personas y organizaciones acceder a tecnologías avanzadas. Modelos como DeepSeek-R1 también fomentan la colaboración y la innovación global, reduciendo la dependencia de soluciones comerciales cerradas.

Disponibilidad y cómo probarlo

Los interesados pueden probar DeepSeek-R1 como DeepThink en la plataforma de chat de DeepSeek, que funciona de manera similar a ChatGPT. Además, el modelo está disponible para descarga e integración a través de su API en Hugging Face.

DeepSeek-R1 representa un gran paso adelante en la carrera por desarrollar inteligencia artificial avanzada y asequible. Su rendimiento competitivo y su naturaleza open-source lo convierten en una opción prometedora para quienes buscan aprovechar el poder de la IA sin los costes asociados a los modelos comerciales.