Facebook nesėkmė parodo, kodėl neturėtume juo pasikliauti viskuo

Turinys:

Facebook nesėkmė parodo, kodėl neturėtume juo pasikliauti viskuo
Facebook nesėkmė parodo, kodėl neturėtume juo pasikliauti viskuo
Anonim

Pagrindiniai pasiėmimai

  • „Facebook“techninės problemos buvo apgailėtinos, bet greičiausiai problema būtų išspręsta daug greičiau, jei ji nebūtų pagrįsta tiek daugybe tarpusavyje sujungtų sistemų.
  • Nėra būdo visiškai išvengti sistemos gedimų, tačiau yra būdų, kaip sumažinti jų tikimybę.
  • Turėdami atsarginių planų, kada (ne tada, kada) sistema sugenda, galite skirtis tarp „erzinančių“ir „katastrofiškų“.
Image
Image

Neseniai vykęs „Facebook“žlugimas parodo, kaip tarpusavyje sujungtos sistemos gali sugesti ir kodėl neturėtume jų naudoti viskam.

Pirmadienį kelioms valandoms prarasti „Facebook“, „WhatsApp“ir „Instagram“buvo nepatogu, žalinga įmonėms, o kai kuriais atvejais – beveik katastrofiška. „Facebook“teigimu, visa tai įvyko dėl tinklo koordinuojančių maršrutizatorių konfigūracijos pakeitimų.

Tai pagrįstas paaiškinimas, tačiau faktas, kad dėl vienos tokios klaidos gali sustoti ne tik „Facebook“, bet ir kitos „Facebook“priklausančios sistemos, kelia nerimą.

Pakeitus vieną neteisingą maršrutizatoriaus konfigūraciją, kelios paslaugos ir net VR ausinės visiškai nustojo veikti. Be to, paties „Facebook“pripažinimu, tai taip pat turėjo pakopinį poveikį bendrovės duomenų centrų bendravimui ir sustabdė visas jų paslaugas.

„Pasikliovimas tarpusavyje sujungtomis sistemomis iš tikrųjų kelia įgimtą sistemos ar net paslaugos gedimo riziką“, – sakė Francesco Altomare, GlobalDots vyresnysis techninių pardavimų inžinierius, interviu su Lifewire,.

"Siekdamos įveikti šią bauginančią riziką, įmonės naudoja SRE (System Reliability Engineering) principą, taip pat kitus įrankius, kurie visi susiję su įvairaus lygio atleidimu į kiekvieną sistemos infrastruktūros sluoksnį."

Image
Image

Kas gali suklysti

Verta pažymėti, kad kai tokia sistema sugenda, paprastai reikia audros, kad viskas klostytųsi ne taip. Tai mažiau kaip kortų namelis, laukiantis kritimo, o labiau į atvirą šiluminio išmetimo angą kosminėje stotyje, kurios dydis prilygsta mažam mėnuliui.

Dauguma įmonių imasi veiksmų, siekdamos užtikrinti, kad vienas dalykas, galintis viską suvesti į chaosą, niekada neįvyktų, bet nepaisant to, tai gali atsitikti.

„Netikėtos gedimai yra verslo dalis ir gali kilti dėl darbuotojų aplaidumo, interneto paslaugų teikėjo tinklo gedimų ar net dėl debesies saugojimo paslaugų problemų“, – sakė Sally Stevens, FastPeopleSearch įkūrėja. interviu el. paštu.

"…Kol bus atlikti būtini sistemos apsaugos veiksmai, pvz., atsarginės kopijos, maršruto parinktuvas ir pakopinė prieiga, šie gedimai yra mažai tikėtini." Nors net ir naudojant daugybę saugiklių, smeigtukas vis tiek gali sugesti.

Jei sugenda sistema, valdanti tokius dalykus kaip pirminiai kontaktai, prietaisai, durys ir kt., rezultatai gali būti reikšmingi. Nuo nedidelių nepatogumų iki visiškos katastrofos, priklausomai nuo to, kiek asmenys ir įmonės visa tai pasitiki.

Image
Image

"Taip pat yra rizika, kad įsilaužėliai pateks į sistemą iš bet kurio mažiausiai apsaugotų įrenginių, pvz., šaldytuvų ir orkaitės skrudintuvų", - pridūrė Stevensas, "o tai gali sukelti duomenų vagystes ir išpirkos programas."

Kaip galime pasiruošti

Nėra jokio būdo užtikrinti, kad sistema niekada nesuges, tačiau yra veiksmų, kurių galima imtis siekiant sumažinti gedimo tikimybę arba sklandžiau pašalinti gedimą. Idealus būtų šių dviejų metodų derinys, kuris suderintų su gedimų apsauga ir atsakomąsias priemones su nenumatytų atvejų planais ir atsarginėmis sistemomis.

„Kad būtų pašalinti šie pavojai, kuriuos sukelia efektyviai valdomi trečiųjų šalių produktai ir paslaugos, turi būti griežtai apibrėžti su trečiosios šalies rizikos valdymu susiję vaidmenys ir pareigos“, – sakė Daniela Sawyer, FindPeopleFast įkūrėja ir vyriausioji technologijų pareigūnė. interviu el. paštu: „Norėdami klestėti šioje naujoje aplinkoje, rizikos valdytojai turi suvokti esmines tokios sudėtingos ekosistemos dalis“.

Tai, kas nutiko „Facebook“, „WhatsApp“ir „Instagram“, buvo gaila, bet, tikiuosi, atveria akis. Žmonės, kurie pasitiki tarpusavyje sujungtomis sistemomis, turi suprasti, kad viskas, kas vyksta neteisingai, gali viską sujaukti. Be to, turi būti įdiegtos priemonės (arba kruopščiai ištirtos ir patobulintos), kad tokie sutrikimai būtų mažiau tikėtini ir jų poveikis būtų mažesnis.

„Facebook“atveju problema buvo ne maršrutizatoriaus problemos, o beveik visa jo ekosistema, susijusi su viskuo. Taigi, „Facebook“(paslaugai) neveikiant, „Facebook“(įmonei) teko skirti daug daugiau laiko ir energijos paprasčiausiai organizuoti ir spręsti problemą. Jei jis nenaudotų tokios giliai įsišaknijusios, tarpusavyje sujungtos sistemos arba būtų turėjęs atsarginių planų, kaip susidoroti su tokiu gedimu, greičiausiai tai būtų užtrukę daug mažiau laiko.

Rekomenduojamas: