Etiqueta: modelos de lenguaje

DeepSeek da un paso firme hacia el código abierto: qué significa abrir su motor de inferencia

Publicado el 15 abril, 2025

El ecosistema de la inteligencia artificial está viviendo una transformación notable. Cada vez más compañías apuestan por abrir el código de sus herramientas para impulsar la innovación colectiva. Una de las más recientes en sumarse a esta ola es DeepSeek AI, un laboratorio de inteligencia artificial con sede en China que acaba de anunciar que liberará el motor de inferencia de sus modelos.

Este paso no solo refleja un compromiso con la comunidad de desarrolladores y académicos, sino que también marca una tendencia cada vez más fuerte: los modelos de IA ya no solo son propiedad privada de grandes corporaciones, sino que comienzan a ser parte de un ecosistema abierto, colaborativo y global. Continúa leyendo «DeepSeek da un paso firme hacia el código abierto: qué significa abrir su motor de inferencia»

GPT-4.1 de OpenAI: el nuevo estándar para la inteligencia artificial práctica y eficiente

Publicado el 14 abril, 2025

por Natalia Polo

OpenAI ha dado un paso firme en el mundo de la inteligencia artificial con la presentación de GPT-4.1, una evolución significativa frente a sus versiones anteriores. Con este lanzamiento, también llegan GPT-4.1 Mini y GPT-4.1 Nano, modelos más ligeros y accesibles que prometen democratizar aún más el uso de la IA. Pero ¿qué tienen de especial estas nuevas versiones y por qué están generando tanto ruido en el sector tecnológico?

Vamos a desglosar todo lo que necesitas saber sobre esta nueva familia de modelos de lenguaje y cómo puede impactar desde el desarrollo de software hasta la educación y el entretenimiento. Continúa leyendo «GPT-4.1 de OpenAI: el nuevo estándar para la inteligencia artificial práctica y eficiente»

Así piensan los humanos y las IA: una brecha que los algoritmos aún no pueden cruzar

Publicado el 7 abril, 2025

por Natalia Polo

Los sistemas de inteligencia artificial están avanzando a pasos agigantados. Cada día vemos cómo son capaces de escribir textos coherentes, resolver problemas complejos o incluso aprobar exámenes. Pero, ¿significa eso que «piensan» como los humanos? Una reciente investigación ha demostrado que la respuesta sigue siendo un rotundo no.

Aunque las IA pueden parecer listas, su “forma de pensar” sigue siendo radicalmente distinta a la nuestra. No se trata solo de una diferencia técnica, sino de un abismo en la manera en que entendemos el mundo, aprendemos de él y aplicamos ese conocimiento a nuevas situaciones. Continúa leyendo «Así piensan los humanos y las IA: una brecha que los algoritmos aún no pueden cruzar»

Open Deep Search: el nuevo rival de Perplexity y ChatGPT Search que quiere democratizar la búsqueda con IA

Publicado el 4 abril, 2025

por Juan Diego Polo

La búsqueda de información ha cambiado radicalmente con la llegada de la inteligencia artificial. Herramientas como ChatGPT Search o Perplexity AI ya no solo responden preguntas, sino que también entienden el contexto, investigan por ti y presentan respuestas bien estructuradas. Pero hasta ahora, la mayoría de estas soluciones han estado cerradas al público: sistemas propietarios, sin posibilidad de modificar o adaptar a necesidades específicas.

Continúa leyendo «Open Deep Search: el nuevo rival de Perplexity y ChatGPT Search que quiere democratizar la búsqueda con IA»

El modelo o3 de OpenAI podría ser mucho más caro de lo esperado: ¿vale la pena tanta potencia?

Publicado el 3 abril, 2025

por Juan Diego Polo

Cuando se trata de inteligencia artificial avanzada, la promesa de modelos cada vez más potentes suele venir acompañada de una pregunta incómoda: ¿cuánto cuesta realmente ejecutar estas maravillas tecnológicas? OpenAI, conocida por estar a la vanguardia en este terreno, presentó a finales del año pasado su nuevo modelo o3, diseñado para tareas de razonamiento complejo. Sin embargo, nuevas estimaciones sugieren que esta inteligencia podría ser tan cara como brillante.

Continúa leyendo «El modelo o3 de OpenAI podría ser mucho más caro de lo esperado: ¿vale la pena tanta potencia?»

Claude AI bajo la lupa: cómo Anthropic está desentrañando el misterio de los modelos de lenguaje

Publicado el 2 abril, 2025

por Natalia Polo

Durante años, los modelos de lenguaje de gran escala (LLM) han sido como cajas negras: extremadamente útiles, pero con un funcionamiento interno que muy pocos comprenden a fondo. Aunque parezca que simplemente generan texto palabra por palabra, lo cierto es que sus procesos son mucho más complejos. Ahora, gracias a una nueva técnica llamada circuit tracing, la empresa Anthropic ha comenzado a levantar el velo sobre cómo piensa su modelo Claude 3.5 Haiku. Continúa leyendo «Claude AI bajo la lupa: cómo Anthropic está desentrañando el misterio de los modelos de lenguaje»

Más detalles sobre Gemini 2.5 Pro: la nueva joya de la IA que piensa, programa y hasta te pasa el “vibe check”

Publicado el 28 marzo, 2025

por Juan Diego Polo

En el vertiginoso mundo de la inteligencia artificial, donde lo que hoy es revolucionario mañana ya es parte del pasado, Google acaba de lanzar Gemini 2.5 Pro, su modelo más avanzado hasta la fecha. Y sí, cuando decimos avanzado, nos referimos a una IA que no solo responde preguntas o genera texto, sino que razona, entiende contextos complejos, crea código útil y tiene “buena vibra”.

Continúa leyendo «Más detalles sobre Gemini 2.5 Pro: la nueva joya de la IA que piensa, programa y hasta te pasa el “vibe check”»

Midjourney y su inesperado giro hacia la escritura creativa con IA

Publicado el 27 marzo, 2025

por Natalia Polo

Midjourney, conocido por su dominio en la generación de imágenes mediante inteligencia artificial, ha sorprendido recientemente con un nuevo rumbo que pocos esperaban: la mejora de la creatividad en los modelos de lenguaje. Aunque su plataforma se ha convertido en una referencia para crear imágenes surrealistas y artísticas con solo una línea de texto, ahora la empresa ha puesto la mirada en los textos generados por IA. Y lo hace con una propuesta técnica novedosa que promete oxigenar un terreno que empieza a mostrar síntomas de estancamiento: el de los textos automatizados que suenan todos igual.

Desde wwwhatsnew.com nos parece un paso lógico e interesante. Si ya has logrado que las máquinas pinten como artistas, ¿por qué no enseñarles a escribir como escritores?

Continúa leyendo «Midjourney y su inesperado giro hacia la escritura creativa con IA»

DeepSeek y el nuevo papel de la inteligencia artificial en el ejército chino

Publicado el 26 marzo, 2025

por Natalia Polo

En los últimos años, la inteligencia artificial (IA) ha dejado de ser una herramienta exclusiva del mundo empresarial o académico. Ahora, su uso se expande a sectores tan delicados como el militar, y un nuevo ejemplo de esto es lo que está ocurriendo con la inteligencia artificial DeepSeek en el ejército chino, específicamente en las operaciones no combativas de la Ejército Popular de Liberación (EPL).

Desde wwwhatsnew.com llevamos tiempo siguiendo la evolución de estos sistemas, y creemos que este caso es especialmente interesante por lo que revela: cómo un país potencia su infraestructura militar aprovechando tecnologías que, hasta hace poco, parecían ajenas al entorno castrense. Continúa leyendo «DeepSeek y el nuevo papel de la inteligencia artificial en el ejército chino»

SEARCH-R1: La nueva técnica que permite a los modelos de lenguaje pensar y buscar al mismo tiempo

Publicado el 23 marzo, 2025

por Natalia Polo

Los modelos de lenguaje grande (LLM) han evolucionado a pasos agigantados en los últimos años. Hoy en día son capaces de redactar textos, resolver problemas y mantener conversaciones de forma sorprendentemente natural. Pero hay un terreno donde aún cojeaban: integrar información externa y actualizada de forma fluida en su proceso de razonamiento.

¿El problema? Aunque estas inteligencias artificiales pueden razonar, a menudo lo hacen con conocimientos que se quedaron congelados en el tiempo, limitados a la fecha de su último entrenamiento. Esto es como intentar resolver un crucigrama con un diccionario de hace diez años: puede que aciertes algunas, pero otras estarán completamente desactualizadas.

Desde WWWhatsnew.com venimos siguiendo de cerca este tipo de desafíos, y hoy nos parece interesante destacar una solución prometedora: SEARCH-R1, una técnica desarrollada por investigadores de la Universidad de Illinois en Urbana-Champaign y la Universidad de Massachusetts Amherst. ¿Qué hace especial a SEARCH-R1? Permite que un LLM no solo razone, sino que también realice búsquedas en tiempo real mientras piensa, integrando los resultados directamente en su línea de razonamiento.

Continúa leyendo «SEARCH-R1: La nueva técnica que permite a los modelos de lenguaje pensar y buscar al mismo tiempo»