Wielka awaria Amazon Cloud Service. Problemy miały firmy na całym świecie

Problemy miały Fortnite, Disney+, Lyft, Reddit czy strony przewoźników lotniczych, opartych na Amazon Web Services (AWS). Przestały bowiem działać usługi jednego z największych dostawców usług w chmurze.

Amazon tłumaczy się "problemem operacyjnym, który dotknął wiele serwisów". Firma zapewnia jednak, że "pracuje nad wieloma równoległymi ścieżkami, by przyspieszyć powrót usług". AWS dodaje też, że widzi "pierwsze, znaczące oznaki powrotu do działania" wszystkiego, co zostało wyłączone.

Paraliż dotknął firmy z wszystkich sektorów. Oprócz samego Amazona, padły też usługi taksówek na aplikację Lyft, serwis streamingowy Disney+, media jak New York Times, czy przewoźników lotniczych jak United Airlines i operatorów telefonicznych (choćby amerykański oddział T-Mobile).

Ucierpiały też popularne gry i serwisy społecznościowe, czyli Roblox, Fortnite i Reddit. Problemy zgłaszała także giełda kryptowalut Coinage.

– Dzisiejsza awaria AWS US-EAST-1 pokazuje, jak nawet największe środowiska chmurowe mogą zostać sparaliżowane przez z pozoru drobny element infrastruktury. W tym przypadku problem dotyczył DNS-a, czyli fundamentu komunikacji w sieci. Kiedy przestaje działać rozwiązywanie nazw domen, całe aplikacje i usługi mogą przestać odpowiadać, niezależnie od tego, jak dobrze są zaprojektowane – tłumaczy Marek Szustak, IT Security Officer w internetowym biurze podróży eSky.pl.

– To dobra lekcja dla firm korzystających z chmury: warto projektować systemy tak, aby awaria jednego regionu lub dostawcy nie zatrzymała całego biznesu. Redundancja, geograficzne rozproszenie zasobów i testowanie scenariuszy awaryjnych powinny być standardem, nie luksusem – podsumowuje ekspert.