Hace tan solo unos meses, DeepSeek sacudió los cimientos del mundo tecnológico. Esta compañía china presentó DeepSeek R1, un modelo de razonamiento en inteligencia artificial que, pese a utilizar menos recursos y hardware menos potente, logró equipararse a gigantes como ChatGPT-4. Para muchos, fue como ver a un pequeño barco enfrentarse a un transatlántico y mantenerse a flote. Continúa leyendo «DeepSeek R2: El nuevo contendiente en el mundo de la inteligencia artificial»
Categoría: Deepseek
DeepSeek da un paso firme hacia el código abierto: qué significa abrir su motor de inferencia
El ecosistema de la inteligencia artificial está viviendo una transformación notable. Cada vez más compañías apuestan por abrir el código de sus herramientas para impulsar la innovación colectiva. Una de las más recientes en sumarse a esta ola es DeepSeek AI, un laboratorio de inteligencia artificial con sede en China que acaba de anunciar que liberará el motor de inferencia de sus modelos.
Este paso no solo refleja un compromiso con la comunidad de desarrolladores y académicos, sino que también marca una tendencia cada vez más fuerte: los modelos de IA ya no solo son propiedad privada de grandes corporaciones, sino que comienzan a ser parte de un ecosistema abierto, colaborativo y global. Continúa leyendo «DeepSeek da un paso firme hacia el código abierto: qué significa abrir su motor de inferencia»
DeepSeek-GRM: una nueva apuesta abierta para mejorar la evaluación en modelos de lenguaje
En el vertiginoso mundo de la inteligencia artificial, uno de los grandes desafíos es enseñar a los modelos no solo a responder, sino a evaluarse a sí mismos con sentido crítico. Como cuando uno escribe un texto y luego lo relee para detectar errores o mejorar el estilo, las IA también necesitan desarrollar esa capacidad de reflexión. Y eso es precisamente lo que propone DeepSeek con su nuevo modelo DeepSeek-GRM, una ambiciosa propuesta de código abierto que introduce técnicas avanzadas de evaluación interna. Continúa leyendo «DeepSeek-GRM: una nueva apuesta abierta para mejorar la evaluación en modelos de lenguaje»
DeepSeek y Tsinghua se unen para crear modelos de IA que aprenden por sí solos
La inteligencia artificial avanza a pasos cada vez más firmes y veloces. Esta vez, la atención está puesta en DeepSeek, una startup china que ha generado revuelo desde inicios del año con su propuesta de IA de bajo costo y alto rendimiento. En colaboración con investigadores de la prestigiosa Universidad de Tsinghua, están desarrollando modelos que no solo razonan mejor, sino que aprenden a mejorar por sí mismos mientras trabajan.
Este nuevo enfoque tiene un nombre técnico: DeepSeek-GRM, que significa Generalist Reward Modeling o «modelo generalista de recompensas». Y aunque suene complejo, su objetivo es simple: que la IA aprenda como un humano que recibe consejos, se autocorrige y mejora cada vez más con la práctica.
Vamos a desglosarlo para entender qué significa todo esto, por qué es importante y cómo podría cambiar la forma en que usamos la inteligencia artificial en el día a día.
¿Qué es un modelo de recompensa y por qué importa?
Imagina que estás enseñando a un niño a andar en bicicleta. Cada vez que lo hace bien, le das una palabra de aliento o una sonrisa. Si comete un error, lo corriges con cuidado. Así, poco a poco, mejora.
Los modelos de recompensa en IA funcionan de forma parecida. Se les enseña qué tipo de respuestas o acciones son «buenas» y cuáles no lo son. A esto se le llama aprendizaje por refuerzo (reinforcement learning, en inglés). Es una técnica clave para que la IA no solo procese datos, sino que tome decisiones más acertadas en función de lo que ha aprendido.
Hasta ahora, esta técnica se usaba en contextos muy específicos, como juegos o tareas matemáticas. Pero escalarla a situaciones más generales y complejas (como conversar con humanos o entender textos ambiguos) ha sido un reto. Aquí es donde entra DeepSeek-GRM.
¿Qué propone DeepSeek-GRM?
El avance principal de DeepSeek-GRM está en un nuevo método que han llamado «self-principled critique tuning». En palabras más sencillas, es como si la IA desarrollara una especie de voz interna crítica que la guía a mejorar sus respuestas en tiempo real, sin necesidad de volver a ser entrenada desde cero.
Pongamos un ejemplo cotidiano: imagina que usas un asistente virtual y le preguntas por un restaurante cercano. Si sugiere uno que ya está cerrado, y tú le corriges, este sistema aprendería de ese error en ese mismo momento, ajustando su comportamiento futuro de forma autónoma y precisa.
Esto implica dos grandes beneficios:
Mayor alineación con preferencias humanas: los modelos pueden adaptar sus respuestas a lo que realmente espera el usuario.
Menor necesidad de recursos computacionales: al no tener que rehacer todo el entrenamiento desde cero, el proceso es más eficiente y ecológico.
¿Qué diferencia a DeepSeek de otros actores del sector?
DeepSeek no está sola en esta carrera. Empresas como OpenAI, Meta y Alibaba también están explorando la idea de que los modelos de IA puedan aprender en el acto, mientras realizan tareas.
Pero hay un factor que hace destacar a DeepSeek: su apuesta por modelos más ligeros y eficientes, usando una arquitectura llamada Mixture of Experts (MoE). Esta técnica permite que solo ciertas partes del modelo trabajen en cada momento, como si un equipo de expertos internos se turnara para resolver lo que mejor saben hacer.
Meta, por ejemplo, acaba de lanzar Llama 4, su nuevo modelo de IA, también basado en MoE. Pero incluso ellos han comparado sus avances con los de DeepSeek, reconociendo su eficiencia. Esto dice mucho del impacto que está teniendo esta startup con sede en Hangzhou.
¿Por qué importa que sea de código abierto?
Otro punto clave es que DeepSeek-GRM será modelo de código abierto, lo que significa que cualquier desarrollador, empresa o investigador podrá estudiar su funcionamiento, adaptarlo y usarlo libremente.
Esto es importante por varias razones:
Fomenta la innovación colaborativa: al compartir el conocimiento, se acelera el desarrollo de nuevas aplicaciones prácticas.
Permite auditorías externas: otros expertos pueden revisar el código y asegurarse de que la IA se comporta de forma ética y transparente.
Reduce la dependencia de grandes corporaciones: más jugadores pueden acceder a tecnología avanzada sin pagar altos costos.
Un paso hacia una inteligencia artificial más humana
Más allá de la técnica, el objetivo de fondo es acercar la inteligencia artificial al comportamiento humano. Que no solo responda rápido, sino que entienda el contexto, reconozca errores y se adapte con empatía.
La colaboración entre DeepSeek y la Universidad de Tsinghua es una muestra de cómo la academia y la industria pueden ir de la mano para resolver problemas reales. Al reducir el uso de recursos, hacer los modelos más comprensibles y permitir que aprendan por sí solos, están sentando las bases para una nueva generación de IA más sostenible, accesible y útil.
Este tipo de avances no solo beneficiará a empresas tecnológicas. También podría tener un impacto tangible en sectores como la educación, la salud, el comercio y la administración pública. Imagina sistemas educativos personalizados que se adaptan a cada alumno o asistentes médicos que aprenden de cada paciente para mejorar su diagnóstico.
¿Qué sigue para DeepSeek?
Aunque aún no se ha anunciado una fecha para el lanzamiento de su próximo modelo insignia, está claro que DeepSeek está marcando su propio camino. Al combinar una fuerte base de investigación con decisiones estratégicas como el código abierto y el bajo consumo de recursos, esta startup china está demostrando que hay otras formas de avanzar en inteligencia artificial más allá de las grandes marcas estadounidenses.
El camino hacia una IA verdaderamente útil y ética es largo, pero pasos como este nos acercan a ese horizonte.
DeepSeek acelera su evolución: el modelo V3-0324 y el nuevo pulso tecnológico entre China y Estados Unidos
La inteligencia artificial (IA) se ha convertido en la protagonista de una competencia que va mucho más allá de los laboratorios tecnológicos. Empresas como OpenAI, Google o Anthropic lideran el desarrollo de modelos cada vez más potentes, pero desde China, una firma emergente está cambiando el ritmo del juego: DeepSeek.
Esta startup asiática acaba de actualizar su modelo V3, un paso que, aunque discreto —fue publicado en Hugging Face sin anuncio oficial—, tiene implicaciones muy profundas tanto en lo técnico como en lo geopolítico. Desde WWWhatsnew.com creemos que este tipo de movimientos reflejan un cambio de paradigma: el liderazgo en IA ya no es exclusivo de Silicon Valley. Continúa leyendo «DeepSeek acelera su evolución: el modelo V3-0324 y el nuevo pulso tecnológico entre China y Estados Unidos»
DeepSeek V3: el nuevo modelo de IA que desafía a los gigantes sin hacer ruido
Mientras la mayoría de desarrollos en inteligencia artificial llegan envueltos en campañas publicitarias y grandes anuncios, DeepSeek V3 ha tomado un camino muy diferente: apareció en escena de manera discreta, sin notas de prensa ni eventos de lanzamiento. Y aun así, está dando de qué hablar.
Desde WWWhatsnew.com creemos que vale la pena entender qué hay detrás de este modelo que ya se perfila como uno de los más potentes del mercado, y que, pese a su bajo perfil, podría tener un impacto significativo en el desarrollo de la IA a nivel global. Continúa leyendo «DeepSeek V3: el nuevo modelo de IA que desafía a los gigantes sin hacer ruido»
DeepSeek y el nuevo papel de la inteligencia artificial en el ejército chino
En los últimos años, la inteligencia artificial (IA) ha dejado de ser una herramienta exclusiva del mundo empresarial o académico. Ahora, su uso se expande a sectores tan delicados como el militar, y un nuevo ejemplo de esto es lo que está ocurriendo con la inteligencia artificial DeepSeek en el ejército chino, específicamente en las operaciones no combativas de la Ejército Popular de Liberación (EPL).
Desde wwwhatsnew.com llevamos tiempo siguiendo la evolución de estos sistemas, y creemos que este caso es especialmente interesante por lo que revela: cómo un país potencia su infraestructura militar aprovechando tecnologías que, hasta hace poco, parecían ajenas al entorno castrense. Continúa leyendo «DeepSeek y el nuevo papel de la inteligencia artificial en el ejército chino»
DeepSeek desafía a los gigantes de la IA generativa: ¿Cambio de paradigma en el sector?
En el mundo de la inteligencia artificial generativa (GenAI), un puñado de empresas como OpenAI, Anthropic y Google han dominado el panorama en los últimos años, invirtiendo miles de millones de dólares en el desarrollo de modelos avanzados. Sin embargo, la aparición de DeepSeek, una startup china, ha desafiado esta dinámica con un modelo de alto rendimiento y bajo costo, lo que podría marcar un punto de inflexión en el sector.
DeepSeek y su resistencia a la financiación externa: ¿Estrategia inteligente o riesgo a futuro?
DeepSeek, la startup china de inteligencia artificial que ha revolucionado el sector en los últimos meses, ha decidido seguir un camino poco convencional: no aceptar inversión de capital de riesgo (VC) por el momento. Mientras que otras empresas emergentes del sector de la IA buscan financiamiento millonario de fondos de inversión y grandes corporaciones, el fundador de DeepSeek, Liang Wenfeng, ha optado por mantener el control absoluto de su empresa.
¿Cuáles son las razones detrás de esta decisión? En WWWhatsnew analizamos los motivos que han llevado a DeepSeek a seguir este camino y los posibles escenarios que podrían cambiar su postura en el futuro.
DeepSeek, Open Source, supera a Google Gemini
DeepSeek AI ha irrumpido en el mercado con una propuesta open source, eficiente y accesible, que ha llamado la atención de muchos usuarios, sobre todo por sus ventajas frente a Google Gemini. En este artículo, analizaremos en detalle por qué DeepSeek AI se está convirtiendo en una opción atractiva para quienes buscan un asistente de IA potente, sin restricciones y con un enfoque en la privacidad.
Continúa leyendo «DeepSeek, Open Source, supera a Google Gemini»