18 ноября 2025 года сеть Cloudflare столкнулась с серьезным сбоем, который нарушил работу множества онлайн-сервисов, включая ChatGPT, X и Downdetector. Компания охарактеризовала этот инцидент как "самый худший с 2019 года" и связала его с ошибкой в системе управления ботами.
Проблема возникла из-за неправильной настройки запроса в базе данных ClickHouse, которая генерирует конфигурационный файл для моделей машинного обучения системы управления ботами. Изменения в поведении запроса привели к образованию большого количества дубликатов данных, что вызвало резкий рост размера конфигурационного файла, превышающего лимиты памяти.
В результате этого вышла из строя основная прокси-система, обрабатывающая трафик клиентов, использующих бот-модуль. Клиенты, которые применяли сгенерированные метрики ботами в своих правилах, начали блокировать реальный трафик, в то время как те, кто не использовал эту функцию, оставались в сети.
Cloudflare уточнила, что проблема не связана с DNS, атаками или новыми системами на базе генеративного ИИ – ошибка возникла в внутренней логике обновления конфигурации управления ботами.

Чтобы предотвратить подобные инциденты в будущем, компания объявила о четырех мерах:

  • улучшение обработки конфигурационных файлов и введенных данных;
  • расширение количества глобальных "kill switch" для функций;
  • предотвращение ситуаций, когда core dump или отчеты об ошибках могут перегружать систему;
  • пересмотр всех режимов отказа в ключевых прокси-модулях.

По оценкам Cloudflare, примерно 20% интернет-трафика проходит через ее сеть, поэтому любая ошибка в центральных модулях может иметь глобальные последствия.