Cloudflare раскрыла информацию о серьезном сбое, произошедшем 18 ноября 2025 года, который повлиял на работу значительной части интернета, включая такие сервисы, как ChatGPT, X и Downdetector. Компания охарактеризовала этот случай как "наихудший с 2019 года" и связала его с ошибкой в системе управления ботами.
Проблема возникла из-за неправильной настройки запроса в базе данных ClickHouse, которая генерирует конфигурационный файл для модели машинного обучения в системе управления ботами. Изменения в поведении запроса привели к появлению большого количества дубликатов данных. Это вызвало резкий рост размера конфигурационного файла, который превысил установленные лимиты памяти.
В результате сбоя вышла из строя основная прокси-система, обрабатывающая трафик клиентов, полагающихся на модуль ботов. Клиенты, использующие сгенерированные показатели ботов в своих правилах, начали блокировать легитимный трафик, в то время как компании, не использующие эту функцию, оставались онлайн.
Cloudflare уточнила, что проблема не была связана с DNS, атаками или новыми генеративными системами ИИ – ошибка возникла в внутренней логике обновления конфигурации системы управления ботами.
Чтобы предотвратить подобные инциденты в будущем, компания анонсировала четыре шага:
- улучшение обработки конфигурационных файлов и пользовательского ввода;
- увеличение количества глобальных "выключателей" для функций;
- предотвращение ситуаций, когда дампы памяти или отчеты об ошибках могут перегружать систему;
- пересмотр всех режимов отказа в ключевых прокси-модулях.
По оценкам Cloudflare, примерно 20% интернета проходит через ее сеть, поэтому любая ошибка в центральных модулях может оказать глобальное влияние.