AWS восстанавливается после глобального сбоя, который нарушил работу Slack, Duolingo и сотен других приложений

Логотип Amazon Web Services

Автор фото, Getty Images

    • Автор, Отдел новостей
    • Место работы, Русская служба Би-би-си

В работе сервиса облачных вычилений Amazon Web Services (AWS) произошел глобальный сбой, из-за которого пострадали сотни популярных сайтов и приложений.

По данным Downdetector, сбои наблюдались в работе Zoom, Signal, Slack, Canva, Roblox и многих других сервисов.

В AWS сообщили, что устранили основную проблему, которая привела к сбоям, но для полного восстановления потребуется некоторое время.

Сбой также затронул многие финансовые учреждения, включая британские банки Barclays, Lloyds и Bank of Scotland: пользователи сообщали, что не могли зайти в свои банковские приложения. Кроме того, в социальных сетях появились сообщения, что у некоторых клиентов отклоняются платежи по банковским картам.

В банке Lloyds заявили, что сбои в работе его приложения и приложений дочерних Halifax и Bank of Scotland имеют отношение к проблемам в работе Amazon Web Services.

Подписывайтесь на наши соцсети и рассылку

Amazon Web Services — крупнейший поставщик услуг облачных вычислений. Инфраструктура AWS поддерживает работу миллионов сайтов и платформ крупных компаний, от центров обработки данных AWS зависит работа многих популярных мобильных приложений.

По данным Downdetector, сбой затронул более тысячи компаний. Этот список затрагивает самые разные сферы, от домашних систем видеонаблюдения до фитнес-приложений и игр.

Вот некоторые сервисы, пострадавшие из-за сегодняшнего сбоя:

  • Snapchat
  • Zoom
  • Roblox
  • Clash Royale
  • My Fitness Pal
  • Life360
  • Clash of Clans
  • Fortnite
  • Canva
  • Wordle
  • Signal
  • Coinbase
  • Duolingo
  • Slack
  • Smartsheet
  • PokemonGo
  • Epic Games
  • PlayStation Network
  • Peloton
  • Rocket League
Пропустить Реклама WhatsApp-канала и продолжить чтение.
Канал Би-би-си в WhatsApp

Тут мы публикуем только главные новости и самые интересные тексты. Канал доступен для нероссийских номеров.

Подписывайтесь

Конец истории Реклама WhatsApp-канала

В одном из своих обновлений Amazon сообщила, что проблема, «по-видимому, связана с разрешением DNS для конечной точки API DynamoDB в регионе US-EAST-1» (это крупнейший кластер серверов компании, расположенный на Восточном побережье США).

DNS (Domain Name System — система доменных имен) часто сравнивают с телефонным справочником интернета. Она фактически преобразует привычные людям имена веб-сайтов в их числовые эквиваленты IP-адресов, которые могут быть прочитаны и поняты компьютерами. Этот процесс лежит в основе работы всего интернета, и любые его нарушения могут привести к тому, что веб-браузеры не смогут находить нужный пользователям контент.

В понедельник днем компания сообщила о «значительных признаках восстановления». В 3:03 по тихоокеанскому стандартному времени (10:03 по Гринвичу) компания сообщила, что работа большинства сервисов уже восстановлена.

«Мы можем подтвердить, что глобальные сервисы и функции, зависящие от региона US-EAST-1, также восстановлены», — заявили в компании.

Как объясняет Том Геркен, корреспондент отдела технологий Би-би-си, некоторые сервисы могут восстанавливаться дольше, потому что во время сбоя и до него на него отправлялись запросы с локальных устройств, сейчас они все разом дошли, и системе необходимо обработать их все, что создает повышенную нагрузку.

Amazon также сообщила о проблеме с запуском так называемых «новых экземпляров EC2» — по сути, это виртуальные компьютеры, размещенные на серверах компании, со своим собственным дисковым пространством и операционной системой.

«Если вы все еще сталкиваетесь с трудностями при обращении к конечным точкам (endpoints) сервиса DynamoDB в регионе US-EAST-1, мы рекомендуем очистить кэш DNS», — призвала компания.

После того, как стали восстанавливаться сайты, пострадавшие из-за сбоя, неполадки начались на популярной форумной платформе Reddit. Некоторые пользователи, пытавшиеся открыть сабреддиты, столкнулись с уведомлением о том, что на платформе «слишком много запросов». Почему Reddit испытывает проблемы именно сейчас, когда другие платформы уже восстанавливаются, пока неясно. Неизвестно также, связано ли это со сбоем Amazon Web Services или это отдельная проблема.

За последние годы происходило несколько масштабных сбоев в работе интернет-сервисов, когда проблемы у одной компании вызывали эффект «карточного домика».

В июле 2024 года на многих компьютерах появился «синий экран смерти», который вызвал ошибочный код в программном обеспечении CrowdStrike, которое должно было обеспечивать их кибербезопасность. Около 8,5 миллионов компьютеров временно вышли из строя, что повлияло на работу множества интернет-сервисов.

В июне 2021 года множество сайтов не работало из-за проблем у американского CDN-провайдера Fastly. Тогда пострадал ряд сайтов ведущих мировых СМИ, включая BBC World Service, Guardian, Financial Times и New York Times, а также онлайн-платформы Reddit, GitHub, Twitch и другие. Был недоступен также портал британского правительства gov.uk.

В том же 2021 году, в октябре, «ошибка конфигурации» привела к отключению Facebook, Instagram и WhatsApp почти на шесть часов. Другие сайты, включая X, также испытывали сбои из-за резкого увеличения числа обращений к их приложениям.

В декабре 2020 года Gmail, YouTube, Google Drive и другие сервисы Google вышли из строя одновременно примерно на 90 минут после того, как компания столкнулась с «проблемой внутреннего лимита хранилища».