Rutinsko Cloudflare održavanje jutros je pošlo po zlu i pretvorilo se u još jedan globalni internetni potres. Umjesto mirnog servisa u pozadini, Cloudflare je nakratko srušio vlastiti dashboard, API i dobar dio weba – pa su korisnike diljem svijeta dočekivale samo greške i prazne stranice.
Sve je počelo tijekom planiranog održavanja u Chicagu, koje je krenulo u 07:00 UTC. U 09:00 UTC trebalo je započeti isto takvo održavanje u Detroitu, ali prije nego što su tehnološki laboratoriji stigli do kave, sustavi su počeli javljati crvena upozorenja. U 08:56 UTC Cloudflare je priznao problem, ubrzo pustio zakrpu, a do 09:30 UTC mreža se uglavnom stabilizirala. Ipak, servis Workers – Cloudflareov serverless alat, ne ljudi u data centru – i dalje je prijavljivao poteškoće.
Cloudflare se uvijek voli pohvaliti time da “20 posto svih web stranica koristi Cloudflare zaštitu”. Nažalost, to znači i da tih 20 posto može vrlo lako pasti zajedno ako Cloudflare zakašlje. Ovo je drugi pad u samo dva mjeseca, što neće oduševiti korisnike koji se već pitaju koliko je mudro imati ovoliko jaku ovisnost o jednom vendoru.
Društvene mreže, kao i obično, nisu pomogle situaciji. Val žalopojki “ne radi mi web” širio se brže od same greške.
Iako današnji pad nije trajao kao onaj iz studenog, kada je loša promjena dozvola u bazi podataka srušila ogroman dio interneta, opet je pokazao koliko je krhka infrastruktura koja pokreće svakodnevni web.
Cloudflare se nakon objave oglasi službenom izjavom: promjena u načinu na koji njihov Web Application Firewall parsira zahtjeve privremeno je srušila dostupnost mreže između 08:47 i 09:13 UTC. Naglasili su da nije riječ o napadu, nego o promjeni koju su uveli kako bi ublažili novu ranjivost otkrivenu u React Server Components.
Drugim riječima: internet je opet pao zbog “rutinskog održavanja”, a mi se pravimo da nas to više iznenađuje nego što bi trebalo.









