Crean chip con capacidad para alimentar modelos de IA con 120 billones de parámetros

Publicado el

Crean chip con capacidad para alimentar modelos de IA con 120 billones de parámetros

Los avances alcanzados estos últimos años en IA han sido bastante notables, logrando así el desarrollo de tecnologías orientadas a la optimización de tareas y actividades llevadas a cabo por empresas de diferentes sectores.

Esto, a través de modelos de IA compuestos por instrucciones o algoritmos sofisticados que al ser ejecutados permiten que miles de operaciones y cálculos sean realizados en cuestión de minutos, ayudando con ello a encontrar una solución a los diferentes desafíos que puedan presentarse dentro de determinados procesos de la empresa.

Sin embargo, para alcanzar un alto nivel de eficiencia en las funciones que cumplen, estos modelos requieren ser entrenados a través de grandes cantidades de datos y parámetros que son suministrados por medio de un chip implantado en un procesador.

En este punto también se ha venido innovando, con la fabricación de chips cada vez más robustos y capaces de proporcionar enormes cantidades de parámetros a estos modelos de IA.

En ese sentido, Cerebras Systems, una empresa de sistemas informáticos ha dado a conocer su última creación, el CS-2 Wafer Scale Engine 2, un chip a escala cerebral diseñado para alimentar modelos de inteligencia artificial con una cantidad de 120 billones de parámetros.

Cabe mencionar que a mayor cantidad de parámetros suministrados más sofisticado se vuelve el modelo de IA, razón por la cual Andrew Feldman, fundador y consejero delegado de Cerebras siente confianza al decir que este procesador es muy potente.

Respecto a esto, Feldman expresó lo siguiente «El número de parámetros, la cantidad de memoria necesaria, han crecido exponencialmente […]Tenemos modelos 1.000 veces más grandes que requieren de 1.000 veces más computación, y eso ha ocurrido en dos años. Estamos anunciando nuestra capacidad para soportar hasta 120 billones de parámetros, al agrupar 192 CS-2 juntos. No sólo estamos construyendo clusters más grandes y rápidos, sino que estamos haciendo que esos clusters sean más eficientes.»

En cuanto a sus características, el Wafer Scale Engine (WSE-2) constituye el mayor chip jamás fabricado, así como el procesador de IA más rápido hasta el momento. En sus dimensiones de 7 nanómetros se concentran un total de 2,6 billones de transistores y 850 mil núcleos optimizados para IA. Así también, el WSE-2 posee una cantidad de núcleos 123 veces superior a las unidades de procesamiento grafico de sus competidores, así como una memoria de alto rendimiento mil veces mayor.