NVIDIA y Amazon Web Services (AWS) han dado un paso significativo en su colaboración estratégica al anunciar una expansión que abarca desde hardware hasta servicios en la nube, marcando una nueva etapa en el desarrollo de infraestructuras para inteligencia artificial a gran escala. En el marco del evento AWS re:Invent, ambas compañías presentaron avances clave centrados en una tecnología llamada NVLink Fusion, diseñada para facilitar la interconexión eficiente de chips y sistemas dentro de centros de datos.
AWS incorporará NVLink Fusion en sus próximos chips personalizados, incluyendo el Trainium4, diseñado para entrenamiento e inferencia de modelos de IA, los procesadores Graviton y su sistema de virtualización Nitro. Esta integración permitirá escalar el rendimiento de manera sustancial, aprovechando la arquitectura de racks MGX de NVIDIA ya implementada en los centros de datos de AWS. La alianza apunta a reducir los tiempos de despliegue, mejorar la eficiencia energética y gestionar sistemas de forma más simplificada.
Una infraestructura que combina rendimiento, eficiencia y soberanía
Uno de los focos de esta expansión está en la convergencia entre escalabilidad y soberanía de datos. AWS ha incorporado las arquitecturas NVIDIA Blackwell, incluyendo las GPU HGX B300 y GB300 NVL72, reconocidas por su capacidad para entrenar e inferir modelos complejos. En breve, también estarán disponibles las RTX PRO 6000 Blackwell Server Edition para aplicaciones visuales.
Estas tecnologías respaldan el lanzamiento de las AWS AI Factories, una nueva propuesta que combina centros de datos operados por AWS con hardware NVIDIA, permitiendo a organizaciones implementar servicios de IA avanzados en sus propias instalaciones. El objetivo es ofrecer control total sobre los datos mientras se cumple con regulaciones locales, algo esencial en contextos como el sector público o industrias reguladas.
Este modelo permite a los clientes entrenar y desplegar modelos masivos con la tranquilidad de mantener la soberanía sobre sus datos, al tiempo que acceden a la infraestructura de IA más avanzada del mercado. La alianza compromete a ambas empresas a desplegar nubes de IA soberanas en todo el mundo.
Modelos abiertos y software optimizado para producción
Más allá del hardware, la colaboración se extiende a la capa de software, especialmente con la integración de los modelos abiertos de NVIDIA Nemotron en Amazon Bedrock, la plataforma serverless de AWS para construir aplicaciones de IA generativa. Los desarrolladores ya pueden utilizar modelos como Nemotron Nano 2 y su versión para lenguaje visual, Nano 2 VL, para crear agentes de IA que procesan texto, código, imágenes y video con alta eficiencia.
Esta integración facilita el desarrollo a gran escala sin necesidad de gestionar infraestructura, permitiendo escalar con facilidad desde el prototipo hasta entornos productivos. Empresas como CrowdStrike y BridgeWise ya están aprovechando esta capacidad para desplegar agentes especializados.
Otro avance clave es la aceleración GPU serverless en Amazon OpenSearch Service gracias a la biblioteca abierta cuVS de NVIDIA, que mejora la construcción de índices vectoriales. Esta tecnología permite realizar búsquedas y procesar datos no estructurados hasta 10 veces más rápido y a menor coste, algo fundamental para aplicaciones como la generación aumentada por recuperación (RAG).
IA física y simulación robótica impulsadas desde la nube
La colaboración también se extiende al desarrollo de IA física, un ámbito que requiere grandes volúmenes de datos y capacidades de simulación realistas. Para abordar este desafío, los modelos fundacionales del mundo NVIDIA Cosmos ya están disponibles como microservicios NIM en Amazon EKS, permitiendo controlar robots en tiempo real o realizar simulaciones con alta eficiencia.
Para tareas por lotes, como la generación de datos sintéticos, Cosmos también puede desplegarse en AWS Batch. Estas simulaciones son claves para entrenar y validar robots utilizando herramientas como Isaac Sim y Isaac Lab.
Empresas de robótica como Agility Robotics, ANYbotics y Skild AI ya están utilizando estas herramientas sobre la infraestructura de AWS para acelerar sus procesos de desarrollo, validación y despliegue en el mundo real.
Un ecosistema completo para agentes de IA listos para producción
Para que los agentes de IA sean realmente operativos en producción, se necesita algo más que modelos potentes: hacen falta herramientas de visibilidad, optimización y escalabilidad. En este sentido, AWS y NVIDIA están integrando herramientas como Strands Agents para desarrollo y orquestación, NeMo Agent Toolkit para ajuste de rendimiento, y Amazon Bedrock AgentCore para despliegue seguro y escalable.
Este ecosistema conjunto ofrece una ruta clara y predecible desde el desarrollo hasta la implementación comercial de agentes inteligentes, alineado con las necesidades actuales de las empresas que buscan agilidad sin sacrificar control ni seguridad.
