Amazon Web Services ha elevado en julio de 2026 los precios de sus instancias EC2 Capacity Blocks para cargas de trabajo de IA en aproximadamente un 20%, según informó Tekedia. No es la primera vez: el 4 de enero de 2026, un sábado, AWS ya había anunciado una subida del 15% en esos mismos servicios — la primera subida de precios en más de dos décadas de historia de la compañía. La suma de ambos movimientos en seis meses supone un incremento acumulado de alrededor del 35% para las instancias de GPU más demandadas por quienes entrenan y sirven modelos de inteligencia artificial.
Los números del incremento de enero son concretos: la instancia p5e.48xlarge (ocho GPU NVIDIA H200) pasó de 34,61 dólares/hora (≈ 30,50 euros) a 39,80 dólares/hora (≈ 35,00 euros) en la mayoría de regiones. En US West (Norte de California), el precio subió de 43,26 a 49,75 dólares/hora (≈ 43,80 euros). La instancia p5en.48xlarge pasó de 36,18 a 41,61 dólares/hora. En julio, ese ciclo se repite con una magnitud mayor.
La causa: no es especulación, es física de fabricación
El problema raíz es la memoria HBM (High-Bandwidth Memory), el chip de memoria especializada que se instala junto a las GPU de NVIDIA y AMD para acelerar el acceso a datos en tareas de IA. Los fabricantes de chips — principalmente SK Hynix, Samsung y Micron — han redirigido su capacidad de fabricación hacia la producción de HBM para satisfacer la demanda de los hyperscalers y los centros de datos de IA, lo que ha creado escasez en los tipos de memoria estándar que usan los servidores convencionales.
Las consecuencias son visibles en precios: según TrendForce, la memoria DDR4 ha subido un 158% desde septiembre de 2025, y la DDR5 un 307% en el mismo periodo. La energía tampoco ayuda: en el mercado eléctrico PJM (que abarca desde Illinois hasta North Carolina, uno de los mercados energéticos más importantes para los centros de datos del este de EE.UU.), el precio ha pasado de 34 dólares por megavatio-día en 2023 a 329 dólares en 2026 — un incremento del 868% en tres años.
AWS firmó contratos militares con el Pentágono junto a Microsoft, NVIDIA y Reflection AI en mayo de 2026, lo que confirma que la empresa tiene una posición estratégica en los mercados más asegurados de capacidad de cómputo. Para los clientes comerciales, esto puede traducirse en que los clientes con contratos de menor prioridad son los primeros en recibir restricciones o subidas de precio.
Por qué el precedente es tan importante como la cifra
La frase de Corey Quinn, experto en costes de cloud y voz crítica de referencia en el sector, captura lo estructural de la situación: «AWS lleva dos décadas condicionando a los clientes a esperar que los precios solo bajen. Esa expectativa se ha roto. El precedente ya existe. Cuando has subido los precios una vez y el mundo no se acaba, la segunda subida es más fácil.» El modelo de negocio del cloud computing durante veinte años dependió en parte de esa promesa implícita de deflación perpetua. Lo que sea que quede de esa promesa es discutible.
China está construyendo centros de datos submarinos para aprovechar el mar como refrigerador natural y reducir los costes de energía que están disparando los precios del cómputo convencional: los sistemas de Hailanyun en Hainan ya gestionan más de 7.000 consultas por segundo de modelos de lenguaje con un consumo energético de refrigeración prácticamente cero. Es una respuesta de ingeniería al mismo problema de coste estructural que está detrás de las subidas de AWS.
Andy Jassy, CEO de AWS, reconoció en la call de resultados del primer trimestre de 2026 (30 de abril) que la empresa ha visto un incremento de empresas que migran a la nube precisamente porque ya no pueden conseguir el hardware necesario para sus propios centros de datos. «Vimos que esta tendencia llegaba antes que el mercado, en la segunda mitad del año pasado, y trabajamos con nuestros proveedores estratégicos para asegurar suministro significativo», dijo Jassy. AWS generó 37.600 millones de dólares (≈ 33.100 millones de euros) de ingresos en ese trimestre.
Mi valoración
Hemos analizado la evolución de precios del cloud para cargas de trabajo de IA a lo largo de los últimos dos años y la ruptura del ciclo deflacionario de AWS es el cambio estructural más significativo para los equipos de tecnología desde la llegada del modelo de pago por uso. Lo que más me convence es que la causa no es una decisión estratégica de AWS sino una restricción física de fabricación — lo que significa que Google Cloud y Azure enfrentan el mismo problema y seguirán el mismo camino antes de que termine el año.
Lo que más me preocupa es el efecto en startups que construyeron su infraestructura de IA durante 2023-2025 con créditos cloud gratuitos. Cuando esos créditos expiran — y la mayoría ya han expirado o están próximos a hacerlo — las empresas enfrentan facturas mensuales que pueden representar el 40-60% de su burn rate, calculadas sobre un precio que ya era 15% más caro en enero y otro 20% más caro ahora.
Cerebras, el fabricante de chips de IA que volvió al proceso de IPO en mayo de 2026 con un contrato de 10.000 millones de dólares con OpenAI, representa la apuesta alternativa: chips de wafer-scale especializados en inferencia que consumen menos memoria HBM y ofrecen mejor relación precio/rendimiento para ciertos tipos de cargas de trabajo. A medida que el cómputo genérico de GPU se encarece, las arquitecturas especializadas ganan atractivo relativo.
Mi predicción: antes de finales de 2026 veremos una nueva oleada de migraciones de cloud público a infraestructura híbrida (parte en nube, parte on-premise) en empresas con cargas de IA predecibles. Para los que usen la nube solo en picos, el coste marginal sigue siendo razonable. Para los que la usen como base continua para inferencia de producción, los números ya no favorecen al cloud.
Preguntas frecuentes
¿Qué son las EC2 Capacity Blocks de AWS y quién las usa?
Son un servicio de AWS que permite a los clientes reservar con antelación acceso garantizado a clústeres de GPU para tareas de machine learning. A diferencia de las instancias bajo demanda, las Capacity Blocks se reservan con días o semanas de anticipación para un período de tiempo definido, lo que asegura disponibilidad para trabajos de entrenamiento o inferencia intensiva. Las usan principalmente empresas que necesitan ejecutar trabajos de IA en fechas concretas y no pueden arriesgarse a que no haya GPU disponibles cuando lo necesiten.
¿Debería una empresa migrar de cloud a infraestructura propia para IA?
Depende de la utilización. Para cargas de trabajo con más del 70% de utilización continua, el coste de depreciar hardware propio (8 GPU H200 cuestan entre 220.000 y 280.000 dólares) amortizado en tres años resulta en 15-20 dólares/hora, frente a los casi 40 dólares/hora que cobra AWS post-subida. Para cargas variables, con picos y valles, el cloud sigue siendo más eficiente porque pagas solo lo que usas. La estrategia híbrida — base on-premise para carga predecible, cloud para picos — es la que más analistas recomiendan en 2026.
