Причины и последствия крупного сбоя в работе Amazon Web Services

20 октября 2025 года крупнейший в мире облачный провайдер Amazon Web Services (AWS) столкнулся с серьёзным сбоем , который привел к временной остановке деятельности ряда крупных компаний сайтов и приложений по всему миру. В числе пострадавших оказались платформы Zoom, Signal, Snapchat, WhatsApp, игровые сервисы Roblox, Fortnite, а также финансовые учреждения, включая Lloyds и Bank of Scotland.

Неполадки были вызваны ошибкой в системе управления DNS, отвечающей за базу данных DynamoDB в регионе US-EAST-1, расположенном в Северной Вирджинии).

Два автоматизированных инструмента, предназначенные для обновления DNS-записей, одновременно внесли изменения в адреса серверов, однако их работа не была согласована. В итоге одна система перезаписала уже актуальные записи устаревшими, а вторая – удалила эти устаревшие записи, что повлекло за собой сброс адресов серверов. Это привело к тому, что многие сервисы AWS не смогли корректно обрабатывать запросы.

Чтобы вернуть систему в рабочее состояние, инженерам AWS потребовалось ручное вмешательство, которое заняло приблизительно 15 часов. В компании заявили, что 21 октября основные сервисы были полностью восстановлены, однако отдельные процессы продолжали работать с повышенной нагрузкой из-за необходимости обработки накопившихся запросов.

Не пропустите:  В России стартовала продажа Toyota Urban Cruiser 2026 с полным приводом по цене от 4,1 млн рублей

Сбои, возникающие последовательно, случаются нечасто, но они почти неизбежны в крупных облачных системах, поскольку такие системы отличаются высокой сложностью и взаимосвязанностью компонентов. Этот случай ещё раз подчеркнул необходимость балансировки нагрузки и децентрализации сервисов для обеспечения более высокой надёжности.

Похожие статьи