La última caída de Amazon Web Services (AWS) ha tenido efectos en cadena y ha impactado a servicios financieros, comunicaciones y plataformas digitales. Alex Segura es responsable del Negocio de Sistemas en Solitium. Y nos ha explicado que “el fallo fue pequeño”, pero se ha originado en un centro de AWS en Virginia y ha derivado en una incidencia de DNS «con efectos globales».
¿Qué ha fallado exactamente?
El experto ha detallado que la incidencia se ha originado en DNS, el servicio que traduce los nombres de dominio en direcciones IP. “El servicio de DNS convierte ese nombre en unas IP´S… y ciertos servicios de AWS no sabían contactar con otros servicios”, ha señalado. El error inicial ha provocado un efecto cascada que ha ido tumbando componentes y clientes dependientes.
AWS, la nube que sostiene cientos de servicios
AWS es líder en infraestructura y plataforma en la nube. El experto de Solitium ha subrayado que, aunque el público asocia Amazon a la tienda ‘online’ o a Prime, «su negocio más rentable es el de la nube». Entre los servicios que se alojan en AWS menciona Disney Plus, Netflix, Spotify, Hulu o videojuegos como Fortnite, Roblox o Pokémon.
Impacto: banca, pagos y comunicaciones
La caída ha afectado a entidades y servicios en medio mundo, incluyendo Estados Unidos y España. Bancos como BBVA, ING, Santander y CaixaBank se han visto afectados en mayor o menor medida. En pagos, Bizum y datáfonos en tiendas han fallado durante horas, y en plataformas de venta de entradas como Ticketmaster se han sufrido problemas. En comunicaciones, aplicaciones como WhatsApp, Zoom o Signal han notado el golpe.
No todo AWS se ha caído: servicios más golpeados
No todos los clientes ni todas las regiones de AWS han padecido la misma gravedad. Segura ha citado DynamoDB como uno de los servicios más afectados, clave para bases de datos y operaciones. “Que se te caiga tu base de datos es una de las piezas más importantes del software”, ha avisado. En cambio, infraestructuras como servicio en algunos entornos apenas se ha visto afectada.
¿Se puede evitar? Multicloud e infra híbrida
La resiliencia pasa por redundancia, según Segura: multicloud, infraestructura híbrida y planes de continuidad. “Por poderse, se puede”, ha dicho sobre repartir cargas entre varios hiperescaladores. Eso sí, tiene coste y complejidad, aunque en sectores críticos como la salud o la industria “debería estar por encima del precio”: “Una empresa puede permitirse poner un sistema híbrido… y que, si se te cae la nube, lo puedas levantar en local”, ha explicado.
Los grandes jugadores de la nube
Entre los hiperescaladores cita a AWS como líder indiscutible por volumen cuando hablamos de infraestructura, seguido por Microsoft Azure y Google Cloud. En algunos recuentos, Microsoft se disputa el número uno al sumar otros servicios, pero AWS lidera en IaaS.
Lecciones que deja la caída
La incidencia ha puesto de relieve la dependencia de múltiples sectores de la nube y la necesidad de arquitecturas tolerantes a fallos: DNS robusto, bases de datos replicadas, rutas de pago alternativas y conmutación por error entre proveedores y regiones.
