En la madrugada del lunes, Amazon Web Services (AWS) sufrió una interrupción masiva que afectó a numerosos servicios en todo el mundo. Este incidente, que comenzó en la región US-EAST-1, tuvo repercusiones significativas en plataformas esenciales, incluyendo aplicaciones de inteligencia artificial, servicios financieros y redes sociales. Entre los afectados se encuentran Snapchat, Roblox, PlayStation, y más.
Los primeros reportes de fallos comenzaron a llegar a través de DownDetector, especialmente desde Europa, incluyendo España y el Reino Unido. Los usuarios comenzaron a experimentar problemas de acceso y funcionamiento en diversas aplicaciones y sitios web. AWS, en su primer comunicado, indicó que estaba "investigando tasas de error elevadas y latencias en múltiples servicios".
A las 1:26 AM PDT, se identificó que DynamoDB era uno de los servicios más impactados. Posteriormente, a las 2:01 AM PDT, los ingenieros de AWS determinaron que un problema de resolución DNS era la posible causa raíz de la interrupción. Este fallo impidió la comunicación interna entre varios servicios, lo que resultó en errores en el lanzamiento de instancias y retrasos en la ejecución de procesos.
Entre las 2:30 y 7:30 AM PDT, AWS implementó medidas para restaurar la estabilidad. Se priorizó la recuperación de DynamoDB y se ajustó la gestión de instancias EC2. Para las 7:29 AM PDT, la mayoría de los servicios mostraban signos de recuperación, aunque la compañía continuaba investigando la causa del problema.
El impacto de esta caída fue global, afectando a empresas y servicios en Europa, Estados Unidos y América Latina. Aunque en México el efecto no fue tan visible, muchas operaciones digitales dependen de la infraestructura de AWS. Esto subraya la vulnerabilidad de la economía digital y la necesidad de arquitecturas multirregionales y planes de recuperación ante desastres.
AWS ha asegurado que seguirá fortaleciendo su supervisión y respuesta ante incidentes para mejorar la resiliencia de sus servicios. La compañía mantiene información actualizada sobre el estado de sus servicios en su página oficial.