18 листопада 2025 року мережа Cloudflare зазнала серйозного збою, який порушив роботу багатьох онлайн-сервісів, зокрема ChatGPT, X та Downdetector. Цей інцидент компанія охарактеризувала як "найгірший з 2019 року" і пов'язала його з помилкою в системі управління ботами.
Проблема виникла через неправильну конфігурацію запиту у базі даних ClickHouse, що генерує конфігураційний файл для алгоритмів машинного навчання системи. Зміни в запитах призвели до утворення численних дублікатів, що викликало різке зростання обсягу конфігураційного файлу та перевищення лімітів пам'яті.
В результаті цього сталася відмова основної проксі-системи, яка обробляє трафік клієнтів, що використовують модуль ботів. Клієнти, які спиралися на показники ботів у своїх правилах, почали блокувати справжній трафік, тоді як ті, хто не використовував цю функцію, залишалися в мережі.
Cloudflare підтвердила, що проблема не була пов'язана з DNS, атаками чи новими системами на базі генеративного ШІ – помилка виникла в логіці оновлення конфігурації бот-менеджменту.

Щоб уникнути подібних ситуацій у майбутньому, компанія вжила чотири заходи:

  • покращення обробки конфігураційних файлів та введених даних;
  • збільшення кількості глобальних "kill switch" для функцій;
  • запобігання перевантаженню системи через core dump чи звіти про помилки;
  • перегляд всіх режимів відмови в ключових проксі-модулях.

Cloudflare оцінює, що приблизно 20% світового інтернет-трафіку проходить через її мережу, тому будь-яка помилка в центральних модулях може призвести до глобальних наслідків.