Awaria, która unieruchomiła internet
AWS, czyli Amazon Web Services, to jedna z najpopularniejszych usług chmurowo-serwerowych na świecie, obok Microsoft Azure, z której korzystają miliony firm i aplikacji – od małych startupów po globalne giganty. Umożliwia przechowywanie danych, uruchamianie aplikacji i obsługę ruchu internetowego w oparciu o zdalne serwery Amazona, zamiast własnej infrastruktury IT.
Dzięki temu usługi takie jak Slack, Zoom czy ChatGPT mogą działać szybko i niezawodnie, korzystając z mocy obliczeniowej i zasobów dostępnych w chmurze. Gdy jednak AWS doświadcza awarii, skutki odczuwalne są globalnie – bo tysiące serwisów opiera się właśnie na tej platformie.
Problem dotyczył rozdzielczości DNS
Taka właśnie awaria pojawiła się w poniedziałek 20 października. Nie działały platformy takie, jak Zoom, Signal, ChatGPT, Perplexity, a także usługi Amazona, w tym PrimeVideo i Alexa. Problemy techniczne dotknęły przede wszystkim region US-East-1, obejmujący wschodnie wybrzeże Stanów Zjednoczonych, lecz skutki awarii były odczuwalne także w innych częściach świata – w tym w Polsce.
Jak napisali przedstawiciele Amazona w oficjalnym komunikacie, problem był związany z rozdzielczością DNS – systemu nazw domen, który zamienia adresy internetowe na adresy IP. Dzięki temu mechanizmowi, możliwe jest prawidłowe ładowanie stron internetowych i aplikacji.
– AWS zgłosił wzrost liczby błędów dla wielu usług i ustalił, że problem był związany z rozpoznawaniem nazw DNS punktów końcowych API DynamoDB w regionie Północnej Wirginii (US-East-1) – napisano w komunikacie.
Pierwsze raporty o błędach AWS pojawiły się o godzinie 3:11 czasu wschodniego, czyli w Polsce o godzinie 9:11. Jak wynika z oficjalnego komunikatu firmy, problem został rozwiązany o godzinie 11:24 czasu polskiego.
Poprzednie poważne zakłócenie w globalnym działaniu internetu miało miejsce w 2024 roku, gdy firma CrowdStrike – gigant z branży cyberbezpieczeństwa – opublikowała wadliwą aktualizację swojego oprogramowania antywirusowego. Błąd ten doprowadził do unieruchomienia milionów komputerów na całym świecie, powodując opóźnienia na lotniskach i przerwy w dostawach prądu. Przywracanie systemów do pełnej sprawności zajęło wtedy kilka dni.