Nvidia lleva años consolidándose como el principal proveedor de chips para inteligencia artificial, con sus GPUs dominando centros de datos y laboratorios de investigación en todo el mundo. Pero este dominio en infraestructura ya no parece ser suficiente. La compañía está apostando por un nuevo frente: los modelos de IA de código abierto, una estrategia que busca reforzar su ecosistema y responder a la creciente influencia de China en este terreno. Continúa leyendo «Nvidia entra con fuerza al terreno de los modelos de IA de código abierto»
Etiqueta: modelos de IA
Dejar de usar ChatGPT para todo: modelos de IA más eficientes para tareas específicas
En el universo acelerado de la inteligencia artificial generativa, muchos usuarios caen en la trampa de depender exclusivamente de ChatGPT para cualquier tarea. Sin embargo, al igual que no usamos un destornillador para clavar un clavo, tampoco deberíamos usar un solo modelo de IA para todo. Cada modelo tiene fortalezas únicas que lo hacen más adecuado para ciertos usos, y entender esas diferencias puede mejorar tanto la eficiencia como la calidad de los resultados. Continúa leyendo «Dejar de usar ChatGPT para todo: modelos de IA más eficientes para tareas específicas»
Microsoft presenta sus primeros modelos de IA propios: MAI-Voice-1 y MAI-1-preview
Tras años de colaboración estrecha con OpenAI, Microsoft ha comenzado a forjar su propia identidad dentro del campo de la inteligencia artificial generativa, con el lanzamiento de sus primeros modelos desarrollados completamente de forma interna: MAI-Voice-1 y MAI-1-preview. Ambos modelos marcan un cambio de estrategia importante dentro del ecosistema de Microsoft Copilot, permitiéndole a la empresa un mayor control sobre las tecnologías que impulsan sus productos y servicios.
Este movimiento no implica un rompimiento con OpenAI, pero sí evidencia un deseo de diversificación y de menor dependencia. En lugar de limitarse a consumir lo que terceros producen, Microsoft ahora comienza a construir sus propios cimientos, apostando por una visión de IA más personalizada y ajustada a sus necesidades.
Alibaba presenta Qwen3, su nueva generación de modelos de IA de razonamiento híbrido
La compañía tecnológica Alibaba ha dado a conocer Qwen3, una familia de modelos de inteligencia artificial que promete plantar cara a los mejores sistemas de Google y OpenAI. Estos modelos, disponibles bajo una licencia abierta en plataformas como Hugging Face y GitHub, abarcan desde pequeños sistemas de 0,6 mil millones de parámetros hasta gigantes de 235 mil millones de parámetros.
Para ponerlo en contexto, los parámetros de un modelo podríamos compararlos con el número de piezas de un rompecabezas: cuanto más grande y complejo, mayor detalle y sofisticación en la imagen final. Continúa leyendo «Alibaba presenta Qwen3, su nueva generación de modelos de IA de razonamiento híbrido»
Un estudio para domar a todos los modelos: Prompt Engineering Studio y el arte de crear mejores instrucciones para IA
Los modelos de lenguaje han dejado de ser herramientas misteriosas que solo unos cuantos sabían manipular. Hoy, cada vez más empresas, desde startups hasta corporaciones con miles de empleados, dependen de ellos para tareas críticas: generación de contenido, atención al cliente, análisis de datos, soporte técnico… Pero ¿qué pasa cuando el rendimiento de esas IAs no es consistente, cuando los prompts —esas instrucciones con las que los alimentamos— son una caja negra de prueba y error constante?
Cohere lanza modelos de IA Aya Vision: avances en la comprensión de imágenes y texto
La inteligencia artificial sigue evolucionando a pasos agigantados, y uno de los últimos avances en el campo de la visión computacional proviene de Cohere. La empresa ha lanzado Aya Vision, un conjunto de modelos de inteligencia artificial diseñados para analizar, traducir y generar texto basado en imágenes. Este lanzamiento es especialmente relevante porque los modelos son de código abierto, lo que significa que investigadores y desarrolladores pueden acceder a ellos libremente para proyectos académicos y experimentación.
DeepSeek y sus ambiciosos márgenes de ganancia: ¿realidad o simple especulación?
La inteligencia artificial sigue siendo un terreno donde la innovación y la rentabilidad chocan constantemente. Un claro ejemplo de esto es DeepSeek, una startup china que recientemente ha hecho una declaración sorprendente: sus servicios de IA podrían generar un margen de ganancia del 545%. Sin embargo, este número viene acompañado de varios asteriscos y muchas dudas.
Continúa leyendo «DeepSeek y sus ambiciosos márgenes de ganancia: ¿realidad o simple especulación?»
Alibaba libera acceso gratuito a su modelo de IA generativa para imágenes y videos
Alibaba ha dado un paso importante en la democratización de la inteligencia artificial al anunciar que su serie de modelos generativos Wan 2.1 estará disponible de forma gratuita y con código abierto. Esto permitirá a investigadores, académicos y empresas acceder y modificar estos modelos para crear contenido visual realista a partir de texto o imágenes.
o1 no es un modelo de chat, es otra cosa, y aquí te lo explico
Desde su lanzamiento en octubre de 2024, o1 ha generado opiniones divididas en la comunidad de inteligencia artificial. Mientras que algunos lo consideran una revolución, otros han tenido dificultades para aprovechar su verdadero potencial. Entre estos últimos se encontraba Ben Hylak, quien inicialmente fue escéptico sobre el modelo, pero con el tiempo se convirtió en un usuario habitual. Su viaje de escepticismo a convicción revela una clave fundamental: o1 no es un modelo de chat, sino un generador de reportes.
Continúa leyendo «o1 no es un modelo de chat, es otra cosa, y aquí te lo explico»
Mistral Small 3: La IA de código abierto que desafía a los gigantes
El mundo de la inteligencia artificial sigue evolucionando a pasos agigantados, y en esta carrera por desarrollar modelos más eficientes y accesibles, la startup europea Mistral AI ha dado un golpe sobre la mesa con el lanzamiento de Mistral Small 3. Este nuevo modelo promete rendimiento equivalente a modelos tres veces más grandes, pero con menores costos computacionales y mayor eficiencia.
Continúa leyendo «Mistral Small 3: La IA de código abierto que desafía a los gigantes»