Etiqueta: modelos de lenguaje

Midjourney y su inesperado giro hacia la escritura creativa con IA

Publicado el 27 marzo, 2025

Midjourney, conocido por su dominio en la generación de imágenes mediante inteligencia artificial, ha sorprendido recientemente con un nuevo rumbo que pocos esperaban: la mejora de la creatividad en los modelos de lenguaje. Aunque su plataforma se ha convertido en una referencia para crear imágenes surrealistas y artísticas con solo una línea de texto, ahora la empresa ha puesto la mirada en los textos generados por IA. Y lo hace con una propuesta técnica novedosa que promete oxigenar un terreno que empieza a mostrar síntomas de estancamiento: el de los textos automatizados que suenan todos igual.

Desde wwwhatsnew.com nos parece un paso lógico e interesante. Si ya has logrado que las máquinas pinten como artistas, ¿por qué no enseñarles a escribir como escritores?

Continúa leyendo «Midjourney y su inesperado giro hacia la escritura creativa con IA»

DeepSeek y el nuevo papel de la inteligencia artificial en el ejército chino

Publicado el 26 marzo, 2025

por Natalia Polo

En los últimos años, la inteligencia artificial (IA) ha dejado de ser una herramienta exclusiva del mundo empresarial o académico. Ahora, su uso se expande a sectores tan delicados como el militar, y un nuevo ejemplo de esto es lo que está ocurriendo con la inteligencia artificial DeepSeek en el ejército chino, específicamente en las operaciones no combativas de la Ejército Popular de Liberación (EPL).

Desde wwwhatsnew.com llevamos tiempo siguiendo la evolución de estos sistemas, y creemos que este caso es especialmente interesante por lo que revela: cómo un país potencia su infraestructura militar aprovechando tecnologías que, hasta hace poco, parecían ajenas al entorno castrense. Continúa leyendo «DeepSeek y el nuevo papel de la inteligencia artificial en el ejército chino»

SEARCH-R1: La nueva técnica que permite a los modelos de lenguaje pensar y buscar al mismo tiempo

Publicado el 23 marzo, 2025

por Natalia Polo

Los modelos de lenguaje grande (LLM) han evolucionado a pasos agigantados en los últimos años. Hoy en día son capaces de redactar textos, resolver problemas y mantener conversaciones de forma sorprendentemente natural. Pero hay un terreno donde aún cojeaban: integrar información externa y actualizada de forma fluida en su proceso de razonamiento.

¿El problema? Aunque estas inteligencias artificiales pueden razonar, a menudo lo hacen con conocimientos que se quedaron congelados en el tiempo, limitados a la fecha de su último entrenamiento. Esto es como intentar resolver un crucigrama con un diccionario de hace diez años: puede que aciertes algunas, pero otras estarán completamente desactualizadas.

Desde WWWhatsnew.com venimos siguiendo de cerca este tipo de desafíos, y hoy nos parece interesante destacar una solución prometedora: SEARCH-R1, una técnica desarrollada por investigadores de la Universidad de Illinois en Urbana-Champaign y la Universidad de Massachusetts Amherst. ¿Qué hace especial a SEARCH-R1? Permite que un LLM no solo razone, sino que también realice búsquedas en tiempo real mientras piensa, integrando los resultados directamente en su línea de razonamiento.

Continúa leyendo «SEARCH-R1: La nueva técnica que permite a los modelos de lenguaje pensar y buscar al mismo tiempo»

Claimify: la herramienta que ayuda a verificar lo que dicen los modelos de lenguaje

Publicado el 23 marzo, 2025

por Natalia Polo

Los modelos de lenguaje como ChatGPT han demostrado ser increíblemente útiles para resumir información, redactar textos y responder preguntas complejas. Sin embargo, también tienen un punto débil: a veces, lo que escriben suena bien, pero no es del todo cierto o verificable. Desde wwwhatsnew.com, donde analizamos las tendencias en inteligencia artificial desde hace años, creemos que esta limitación es uno de los mayores retos a resolver si queremos confiar realmente en las respuestas generadas por IA.

Ahí es donde entra en juego Claimify, una nueva herramienta presentada por Microsoft Research que busca solucionar este problema de raíz: extraer afirmaciones precisas, claras y verificables de los textos generados por IA. Es como si tuviéramos un filtro inteligente que selecciona solo las partes que realmente se pueden comprobar, descartando lo demás.

Continúa leyendo «Claimify: la herramienta que ayuda a verificar lo que dicen los modelos de lenguaje»

Interlify: conecta tus APIs con modelos de lenguaje en minutos

Publicado el 17 marzo, 2025

por Juan Diego Polo

En el ecosistema del desarrollo de aplicaciones con inteligencia artificial, una de las mayores barreras para los equipos técnicos es la integración de APIs con modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés). Conectar servicios internos con estos modelos suele ser un proceso tedioso, costoso y, en muchos casos, frustrante. Interlify surge como una solución a este problema, ofreciendo una plataforma que permite integrar APIs con modelos de lenguaje en cuestión de minutos, sin necesidad de escribir código adicional ni gestionar infraestructura compleja.

Continúa leyendo «Interlify: conecta tus APIs con modelos de lenguaje en minutos»

DeepSeek desafía a los gigantes de la IA generativa: ¿Cambio de paradigma en el sector?

Publicado el 14 marzo, 2025

por Natalia Polo

En el mundo de la inteligencia artificial generativa (GenAI), un puñado de empresas como OpenAI, Anthropic y Google han dominado el panorama en los últimos años, invirtiendo miles de millones de dólares en el desarrollo de modelos avanzados. Sin embargo, la aparición de DeepSeek, una startup china, ha desafiado esta dinámica con un modelo de alto rendimiento y bajo costo, lo que podría marcar un punto de inflexión en el sector.

Continúa leyendo «DeepSeek desafía a los gigantes de la IA generativa: ¿Cambio de paradigma en el sector?»

¿Es válido construir startups basadas en LLM Wrappers?

Publicado el 14 marzo, 2025

por Natalia Polo

El auge de la inteligencia artificial ha llevado al desarrollo de múltiples startups que se basan en modelos de lenguaje de gran tamaño (LLM). En este contexto, se ha generado un intenso debate sobre si las empresas que simplemente construyen «wrappers» alrededor de estos modelos pueden sostenerse a largo plazo o si están condenadas a la obsolescencia.

Continúa leyendo «¿Es válido construir startups basadas en LLM Wrappers?»

Google lanza Gemma 3: el modelo de IA más eficiente y potente hasta ahora

Publicado el 13 marzo, 2025

por Natalia Polo

Google ha anunciado el lanzamiento de Gemma 3, la última generación de su familia de modelos de IA de código abierto. Este avance representa un salto significativo en términos de rendimiento, accesibilidad y eficiencia computacional, destacándose entre sus competidores por su capacidad para ejecutarse en una única GPU NVIDIA H100, mientras que otros modelos requieren hasta 32 GPUs.

Continúa leyendo «Google lanza Gemma 3: el modelo de IA más eficiente y potente hasta ahora»

Por qué extraer datos de PDFs sigue siendo un dolor de cabeza para los expertos en datos

Publicado el 13 marzo, 2025

por Natalia Polo

Durante años, empresas, gobiernos e investigadores han enfrentado un desafío persistente: extraer datos utilizables de archivos PDF. Estos documentos digitales contienen información vital, desde investigaciones científicas hasta registros gubernamentales, pero su formato rígido muchas veces convierte esa información en un laberinto impenetrable para las máquinas.

Continúa leyendo «Por qué extraer datos de PDFs sigue siendo un dolor de cabeza para los expertos en datos»

Alibaba lanza QwQ-32B: su nuevo modelo de IA que compite con OpenAI y DeepSeek

Publicado el 9 marzo, 2025

por Natalia Polo

Alibaba Cloud ha presentado su nuevo modelo de inteligencia artificial, QwQ-32B, basado en su LLM (Large Language Model) más reciente, Qwen2.5-32B. Con solo 32.000 millones de parámetros, Alibaba asegura que su rendimiento es comparable al de otros gigantes del sector, como DeepSeek-R1 y OpenAI’s o1, ambos con modelos significativamente más grandes. Este anuncio representa un paso adelante en la optimización de la IA, priorizando la eficiencia sobre la escala bruta.

Continúa leyendo «Alibaba lanza QwQ-32B: su nuevo modelo de IA que compite con OpenAI y DeepSeek»