Meta ha presentado su última innovación en el ámbito de la inteligencia artificial: la próxima generación de chips personalizados diseñados específicamente para mejorar sus cargas de trabajo de IA. Esta nueva versión promete un rendimiento significativamente mejorado en comparación con su predecesora, impulsando los modelos de clasificación y recomendación de anuncios en Facebook e Instagram.
La empresa está invirtiendo fuertemente en su infraestructura de IA, con un enfoque en el apoyo a los nuevos y exigentes productos de IA generativa, sistemas de recomendación y investigación avanzada de IA. A medida que la sofisticación de los modelos de IA evoluciona, también lo hacen sus demandas computacionales, y Meta está lista para satisfacer estas necesidades.
Que es MTIA
El año pasado, Meta presentó al mundo el MTIA v1, su primer acelerador de inferencia de IA diseñado internamente, creado específicamente para sus modelos de recomendación de aprendizaje profundo. Esta tecnología mejoró una variedad de experiencias en las aplicaciones y tecnologías de Meta.
MTIA representa una apuesta a largo plazo para lograr la arquitectura más eficiente para las cargas de trabajo únicas de Meta. A medida que las cargas de trabajo de IA se vuelven fundamentales para sus productos y servicios, esta eficiencia será crucial para brindar las mejores experiencias a los usuarios de todo el mundo.
La próxima generación de MTIA forma parte de un programa de desarrollo de pila completa para silicio personalizado y específico del dominio. Esta nueva versión duplica con creces el rendimiento computacional y el ancho de banda de memoria, manteniendo su estrecha integración con las cargas de trabajo de Meta. Ha sido diseñado para servir de manera eficiente a los modelos de clasificación y recomendación, proporcionando sugerencias de alta calidad a los usuarios.
La arquitectura del chip se centra en lograr un equilibrio óptimo entre el rendimiento computacional, el ancho de banda de memoria y la capacidad de memoria, lo que garantiza un rendimiento excepcional para los modelos de clasificación y recomendación.
Impacto en los centros de datos de Meta
El MTIA ya se ha implementado en los centros de datos de Meta y está contribuyendo activamente a los modelos en producción. La empresa está experimentando resultados positivos, lo que les permite dedicar más recursos computacionales a sus cargas de trabajo de IA más intensivas.
El chip MTIA ha demostrado su versatilidad al manejar con eficacia modelos de clasificación y recomendación de baja y alta complejidad, que son componentes clave de los productos de Meta. El control total de la pila tecnológica permite a Meta lograr una eficiencia mayor en comparación con las GPU (unidades de procesamiento gráfico) comerciales.
MTIA desempeñará un papel crucial en la hoja de ruta a largo plazo de Meta para construir y escalar una infraestructura potente y eficiente para sus cargas de trabajo de IA únicas.
El diseño del silicio personalizado de Meta garantiza su compatibilidad con la infraestructura existente, así como con futuros avances tecnológicos, incluidas las próximas generaciones de GPU. La empresa está invirtiendo no solo en el silicio computacional, sino también en el ancho de banda de memoria, la capacidad de red y otros sistemas de hardware de próxima generación.
Meta ya tiene en marcha varios programas para ampliar el alcance de MTIA, incluyendo soporte para cargas de trabajo GenAI.
La inversión de Meta en infraestructura de IA es parte de una tendencia más amplia en la industria tecnológica. Compañías como Google, con su procesador de IA Tensor Processing Unit (TPU), y Amazon, con sus chips de aprendizaje automático Graviton, también están desarrollando soluciones personalizadas para cargas de trabajo de IA. Estas inversiones demuestran la importancia estratégica de la IA y la necesidad de optimizar la eficiencia computacional.