Usługi Amazon wykazują 'oznaki poprawy' po poważnej awarii, która dotknęła m.in. Snapchat i banki.

Źródło zdjęcia, Reuters
Wiele największych światowych stron internetowych i aplikacji nie działa z powodu awarii dotyczącej Amazon Web Services (AWS).
Snapchat, Duolingo, Zoom i Roblox zostały dotknięte problemem, podobnie jak klienci banków, w tym Lloyds i Halifax.
Trudno dokładnie powiedzieć, ile aplikacji zostało wyłączonych z powodu tej awarii, ale z całą pewnością nie jest to krótka lista – przynajmniej według Downdetectora, strony, na której użytkownicy zgłaszają problemy z działaniem usług:
- Snapchat
- Zoom
- Roblox
- Clash
- Royale
- My Fitness Pal
- Life360
- Clash of Clans
- Fortnite
- Canva
- Wordle
- Signal
- Coinbase
- Duolingo
- Slack
- Smartsheet
- PokemonGo
- Epic Games
- PlayStation Network
- Peloton Rocket League… lista jest naprawdę długa.
Amazon Web Services (AWS) to dział przetwarzania danych w chmurze firmy Amazon, a jego infrastruktura stanowi podstawę działania milionów stron internetowych i platform dużych firm.
AWS informuje, że obecnie „widać znaczące oznaki poprawy" i większość żądań powinna już być realizowana pomyślnie.
Dzisiejsza awaria miała źródło w regionie US-EAST-1 Amazonu w stanie Wirginia, na wschodnim wybrzeżu USA.
To najstarsza i największa lokalizacja giganta technologicznego dla usług internetowych, w której znajduje się wiele centrów danych.
Region ten jest uznawany za kluczowy punkt globalnego internetu i stanowi domyślną lokalizację dla wielu użytkowników.
Ze względu na swój wiek, rozmiar i dużą liczbę żądań w czasie rzeczywistym, jest podatny na awarie.
Sytuacja ta uwidacznia ogromne wyzwanie, jakie wiąże się z tym, że tak wiele firm polega na pojedynczych regionach chmurowych od jednego dostawcy usług.
Masowe awarie internetu stają się coraz poważniejszym problemem

Źródło zdjęcia, Reuters
W ciągu ostatnich pięciu lat doszło do kilku masowych awarii usług internetowych, w których problemy jednej firmy miały ogromne skutki uboczne.
Zazwyczaj takie problemy są rozwiązywane w ciągu kilku godzin, gdy inżynierowie gorączkowo próbują cofnąć błędy lub naprawić je na bieżąco.
Eksperci od dawna wskazują na rosnącą zależność od niewielkiej liczby gigantów internetowych jako czynnik ryzyka. Gdy jedna duża firma ma awarię, wiele aspektów współczesnego życia i biznesu zostaje sparaliżowanych.
Oto kilka przykładów niedawnych masowych awarii i ich przyczyn:
Lipiec 2024: Wadliwy fragment kodu w oprogramowaniu CrowdStrike do cyberbezpieczeństwa został automatycznie zainstalowany w systemach komputerowych, powodując ich awarię i wyświetlanie komunikatu o błędzie „blue screen of death". Około 8,5 miliona komputerów zostało tymczasowo unieruchomionych, co doprowadziło do wyłączenia wielu usług internetowych.
Październik 2021: „Błąd konfiguracji" spowodował wyłączenie aplikacji Facebook, Instagram i WhatsApp na prawie sześć godzin. Inne serwisy, w tym X, również odnotowały zakłócenia z powodu nagłego wzrostu liczby odwiedzin.
Czerwiec 2021: Amazon, Reddit, Twitch, GitHub, Shopify, Spotify i kilka serwisów informacyjnych były niedostępne przez około godzinę po tym, jak klient usług w chmurze Fastly przypadkowo uruchomił wcześniej nieznany błąd.
Grudzień 2020: Gmail, YouTube, Google Drive i inne usługi Google przestały działać jednocześnie na około 90 minut po tym, jak firma poinformowała o „wewnętrznym problemie z limitem pamięci".
Ten tekst został napisany i sprawdzony przez dziennikarzy BBC. Przy tłumaczeniu zostały użyte narzędzia AI, jako część projektu pilotażowego.
Edycja: Magdalena Mis








