Zle nastavený server v Kanade spôsobil 3,5 % pokles vo svetovom prenose dát

Incident zasiahol gigantov ako Couldfare, Reddit, Hulu, AWS, Blizzard či Stream.
Zle nastavený server v Kanade spôsobil 3,5 % pokles vo svetovom prenose dát

Internetový poskytovateľ CenturyLink utrpel v nedeľu 30. augusta vážny výpadok po tom, čo v jednom z dátových centier došlo k nesprávnej konfigurácii, ktorá následne spôsobila na internete chaos.

Chyba sa šírila zo siete CenturyLink a mala dosah aj na iných poskytovateľov internetového pripojenia.

Porucha spôsobila viacerým firmám problém s pripojením sa do siete. Medzi zasiahnuté firmy patrili Amazon, Twitter, Microsoft (Xbox Live), EA, Blizzard, Steam, Discord, Reddit, Hulu, Duo Security, Imperva, NameCheap, OpenDNS a mnoho ďalších.

Podľa analýzy spoločnosti Claudfare, ktorá bola taktiež zasiahnutá, viedol tento výpadok k celosvetovému poklesu prenosu dát o 3,5 %.

Podľa vyjadrenia predstaviteľov CenturyLinku vznikla chyba v dátovom centre v Kanade v meste Mississauga. Koreňom problému bolo nesprávne upozornenie Flowspec.

Flowspec je nadstavbou smerovacieho protokolu BGP, ktorá umožňuje lepšie pokynovanie dátového toku na základe zdrojovej a cieľovej destinácie, ale aj L4 parametrov či dĺžky a fragmentácie paketov. Táto metóda umožňuje vykonávať zmeny v sieti v reakcii na prípadné DDoS útoky.

Dátové centrum v Mississauge poslalo chybné upozornenie Flowspec a to zabránilo správnemu nadviazaniu trás BGP, ktoré sú základom pre funkčné internetové služby. Za normálnej prevádzky totiž informujú každého internetového poskytovateľa, ktorá IP adresa je na ich sieti dostupná.

Keďže nesprávne upozornenie Flowspec spôsobilo pád niekoľkých trás v rámci vlastnej siete, niektoré trasy takisto začali upozorňovať na nesprávne BGP trasy susedných internetových poskytovateľov, čo spôsobilo domino efekt a masívne výpadky.

V reakcii požiadala firma CenturyLink ostatných internetových poskytovateľov, aby ignorovali celú premávku z ich siete. Firmy len zriedkakedy siahnu po takých krokoch, keďže vedú k úplnému výpadku siete pre svojich zákazníkov.

CenturyLink musel následne resetovať všetky zariadenia a začať s čistými BGP trasami – celý tento proces, a teda aj výpadok, trval takmer sedem hodín.


Lenka Gallovičová