Rosie, una mestiza de staffy y shar pei rescatada de un refugio en Sídney, parecía una de esas segundas oportunidades que cambian una casa entera. Su dueño, el emprendedor tecnológico Paul Conyngham, la adoptó en 2019, justo cuando el planeta empezaba a aprender lo que significaba vivir a golpe de restricciones y rutinas nuevas. Años… Continúa leyendo »
Nvidia se prepara para la era de la inferencia: la nueva batalla por ejecutar IA rápido y barato
Nvidia construyó buena parte del auge moderno de la IA con sus GPU, chips muy versátiles que sirven tanto para entrenar como para ejecutar modelos. Esa versatilidad fue una ventaja cuando el sector necesitaba una herramienta “para todo”. El problema es que la inferencia premia la especialización: baja latencia, alto rendimiento por vatio, buen precio por token y capacidad para mantener conversaciones largas sin que el sistema se ahogue.
Con el mercado girando hacia servicios en tiempo real, han crecido los rivales que ofrecen rutas alternativas. Algunos gigantes tecnológicos empujan sus propios aceleradores, como las TPU de Google, mientras que compañías especializadas presumen de chips hechos para “hablar” con modelos de lenguaje de forma más eficiente. Este contexto explica por qué Nvidia, aun estando en una posición de fuerza, está tratando el momento actual como una defensa activa de su liderazgo, no como una simple vuelta de victoria. Continúa leyendo «Nvidia se prepara para la era de la inferencia: la nueva batalla por ejecutar IA rápido y barato»