Până Amazon a fost remediată: cum a afectat întreruperea servicii precum Snapchat și bănci

De Bianca Ion 283 citiri
6 min citire
pana_amazon_a_fost_remediata_cum_a_afectat_intreruperea_servicii_precum_snapchat_si_banci.webp.webp

Amazon Web Services (AWS) a anunțat luni seara că a remediate o întrerupere majoră care a afectat mii de site-uri și aplicații, inclusiv Snapchat și băncile Lloyds și Halifax.

În cursul zilei de luni, milioane de utilizatori din întreaga lume s-au confruntat cu dificultăți în accesarea unor servicii online esențiale. O pană de amploare la Amazon Web Services a blocat peste 1.000 de platforme, printre care Snapchat, bănci importante și aplicații populare. Serviciile au fost afectate ore întregi, iar utilizatorii au raportat probleme la scară largă.

Ce a cauzat problemele pentru serviciile online?

Primele semne ale întreruperii au apărut în jurul orei 07:00 (ora României), când utilizatorii au început să întâmpine dificultăți în accesarea unor platforme precum Snapchat, Duolingo sau Fortnite. Platforma de monitorizare Downdetector a înregistrat peste 11 milioane de rapoarte de erori până la sfârșitul zilei, de peste patru ori mai multe decât într-o zi obișnuită.

  • Snapchat: utilizatorii nu au putut trimite mesaje
  • Lloyds și Halifax: clienții nu și-au putut verifica conturile
  • Fortnite și Duolingo: întreruperi de durată
  • Reddit: dificultăți la încărcarea postărilor

Amazon a precizat într-un comunicat că defecțiunea a avut legătură cu „rezolvarea DNS a endpoint-ului API DynamoDB în regiunea US-EAST-1”. DNS, adică Domain Name System, este sistemul care traduce numele site-urilor în adrese IP, asemănător unei agende telefonice pentru internet. Când acest sistem nu funcționează, browserul nu poate localiza site-urile dorite.

De ce a durat remedierea atât de mult?

Mike Chapple, profesor la Universitatea Notre Dame, a comparat situația cu o pană de curent:

„E ca atunci când ai o pană de curent la scară largă. Echipele încep să lucreze pentru a încerca să o repună în funcțiune.”

„Curentul poate pâlpâi de câteva ori.”

Amazon a recunoscut că a fost nevoită să limiteze temporar unele servicii pentru a putea rezolva problema de bază.

Opiniile experților: dependența de furnizorii mari de servicii cloud

Profesorul Alan Woodward de la Universitatea din Surrey a explicat:

„Ceea ce a evidențiat acest episod este cât de interdependente sunt infrastructurile noastre.”

„Multe servicii online se bazează pe terți pentru infrastructura lor fizică, iar asta arată că pot apărea probleme chiar și la cei mai mari dintre acești furnizori terți.”

„Erori mici, adesea cauzate de oameni, pot avea un impact larg și semnificativ.”

Matthew Prince, directorul executiv al Cloudflare, a declarat pentru BBC:

„Toată lumea are o zi proastă; astăzi Amazon a avut una.”

„Cloud-ul are lucruri uimitoare; îți permite să scalezi… dar dacă există o întrerupere ca aceasta, poate scoate din funcțiune multe servicii de care depindem.”

Cori Crider, de la Future of Technology Institute, a spus:

„Este puțin ca prăbușirea unui pod.”

„O parte esențială a economiei s-a prăbușit.”

„Odată ce aprovizionarea este concentrată la câțiva furnizori monopolisti, când se întâmplă ceva de genul acesta, ia cu el un procent uriaș din economie.”

„Ar trebui să ne gândim serios să achiziționăm mai multe servicii locale, în loc să ne bazăm pe câteva platforme monopol americane.”

„Este un risc pentru securitatea, suveranitatea și economia noastră și trebuie să luăm în considerare separări structurale pentru a face piețele mai rezistente la acest gen de șocuri.”

Cine poartă responsabilitatea pentru consecințe?

Ken Birman, profesor la Universitatea Cornell, consideră că și companiile care folosesc AWS au o parte din responsabilitate:

„Companiile care folosesc Amazon nu au acordat suficientă atenție construirii de sisteme de protecție în aplicațiile lor.”

„Știm cum să consolidăm aceste sisteme și știm cum să o facem în siguranță.”

Consecințele pot fi semnificative. De exemplu, Delta Airlines încă solicită despăgubiri de peste 500 de milioane de dolari de la CrowdStrike, după o pană similară din 2022. Compania a fost nevoită să reseteze manual 40.000 de servere, ceea ce a dus la întârzieri mari ale zborurilor timp de mai multe zile.

Pentru companii, astfel de incidente arată cât de important este să existe soluții alternative și să nu se bazeze exclusiv pe un singur furnizor. Diversificarea rămâne una dintre cele mai eficiente metode de protecție împotriva acestor situații.

Ce urmează pentru Amazon și utilizatorii săi?

Amazon nu a oferit încă detalii complete despre cauza exactă a întreruperii și nici despre măsurile pe care le va lua pentru a preveni incidente similare. Totuși, acest incident a arătat cât de vulnerabile pot fi serviciile digitale atunci când depind de un singur furnizor important.

Pentru utilizatori, acest eveniment subliniază faptul că serviciile online pot fi oricând indisponibile. Pentru companii, diversificarea furnizorilor rămâne esențială pentru a evita astfel de riscuri pe viitor.

Chiar dacă serviciile Amazon Web Services au revenit la normal, discuțiile despre securitatea și reziliența infrastructurii digitale vor continua să fie de actualitate. În viitor, companiile și utilizatorii ar putea fi mai atenți la modul în care își aleg furnizorii de servicii cloud și la măsurile de protecție pe care le implementează.