Wielu użytkowników na całym świecie nie mogło 19 października 2025 roku korzystać z ulubionych serwisów i aplikacji, pisaliśmy o tej sytuacji w tym artykule. Netflix przestał działać, Adobe Creative Cloud wyświetlało błędy, a nawet inteligentne łóżka odmówiły posłuszeństwa. Wszystko przez awarię Amazon Web Services – giganta chmury obliczeniowej, który podtrzymuje znaczną część współczesnego internetu.
Co wywołało masową awarię
Amazon oficjalnie potwierdził źródło problemu. Wszystko zaczęło się w centrum danych w północnej Wirginii, oznaczonym technicznie jako region US-East-1. To właśnie tam wystąpił krytyczny błąd w systemie DynamoDB – usłudze bazodanowej NoSQL należącej do Amazon. Seria awarii systemowych uniemożliwiła tworzenie nowych połączeń sieciowych, co uruchomiło efekt domina.
Problem szybko rozprzestrzenił się na inne fundamentalne komponenty infrastruktury. Amazon Elastic Compute Cloud (EC2) przestał uruchamiać nowe instancje – czyli wirtualne maszyny, na których działa większość współczesnych serwisów internetowych. Przestały również działać systemy równoważenia obciążenia i inne kluczowe usługi AWS.
Skala problemu przerosła oczekiwania
Skutki awarii były zdumiewające. Popularne platformy streamingowe, narzędzia do pracy zdalnej i aplikacje biznesowe jednocześnie straciły połączenie. Co jeszcze bardziej niepokojące – awaria dotknęła także urządzenia smart home, pokazując jak głęboko infrastruktura AWS wrosła w naszą codzienność.
Inżynierowie AWS pracowali przez kilka godzin nad eliminacją kolejnych punktów awarii. Po przywróceniu pełnej funkcjonalności Amazon wydał oficjalne przeprosiny, obiecując szczegółową analizę incydentu i wdrożenie zabezpieczeń zapobiegających podobnym sytuacjom w przyszłości.
Kolejna taka awaria
To nie pierwsza poważna awaria AWS w ostatnich latach. Szczególnie podatny na problemy wydaje się właśnie region w Wirginii. W grudniu 2021 roku trzy osobne awarie pochodzące z różnych regionów sparaliżowały Disney+, Slack i Zoom. W czerwcu 2023 roku ponad sto usług przestało działać z powodu błędu w wewnętrznych systemach AWS. Z kolei w lipcu 2024 roku wadliwa aktualizacja oprogramowania CrowdStrike wywołała masowe problemy w systemach klienckich.
Powtarzające się incydenty rodzą pytania o rzeczywistą niezawodność chmury obliczeniowej i nadmierną centralizację infrastruktury internetowej wokół kilku kluczowych dostawców.

