En el mundo de la tecnología, cada vez es más evidente la importancia de los modelos de lenguaje y la inteligencia artificial generativa. Sin embargo, estos modelos requieren una enorme cantidad de potencia de cálculo para su entrenamiento y ejecución. Consciente de esta necesidad, Google Cloud ha anunciado en el evento Google I/O la llegada de las nuevas máquinas virtuales A3 supercomputadoras, diseñadas específicamente para satisfacer las exigencias de estos casos de uso que demandan muchos recursos.
Potencia y rendimiento para cargas de trabajo intensivas
Las VM A3 se han construido con el objetivo de ofrecer el más alto rendimiento en el entrenamiento de las cargas de trabajo de aprendizaje automático actuales. Google Cloud ha equipado estas máquinas con las potentes tarjetas gráficas H100 de Nvidia, además de utilizar procesadores Intel Xeon Scalable de cuarta generación, memoria de host de 2 TB y una impresionante capacidad de ancho de banda de 3,6 TB. Estas características permiten alcanzar hasta 26 exaFlops de potencia, lo que mejora significativamente los tiempos y costos relacionados con el entrenamiento de modelos de aprendizaje automático más grandes.
Innovación en la infraestructura y networking
Pero no es solo cuestión de hardware. Estas VMs se ejecutan en el Jupiter data center de Google, que cuenta con una red de más de 26.000 GPUs altamente interconectadas. Esta infraestructura de red única permite enlaces ópticos reconfigurables de ancho de banda completo, capaces de ajustar la topología de la red según la demanda. Este enfoque innovador no solo contribuye a mejorar el rendimiento, sino que también ayuda a reducir los costos de ejecución de estas cargas de trabajo.
Flexibilidad para los clientes
Google Cloud ofrece a los clientes dos opciones para aprovechar las capacidades de las VM A3. Por un lado, los usuarios pueden optar por ejecutar estas VMs por sí mismos utilizando Google Kubernetes Engine (GKE) y Google Compute Engine (GCE). Esta opción les brinda un mayor control y personalización sobre la infraestructura. Por otro lado, está la opción de utilizar el servicio gestionado de Google, donde la compañía se encarga de la mayor parte de las tareas pesadas. Esta opción permite a los clientes utilizar las VMs A3 en Vertex AI, la plataforma de aprendizaje automático gestionada de Google.
Los interesados se pueden apuntar en este enlace.
Como veis, si bien las nuevas VMs A3 han sido anunciadas en Google I/O, actualmente solo están disponibles a través de una lista de espera para obtener acceso anticipado.
Imagen: cloud.google.com