Categorie: Stiri

Sunt Centrele de Date pregătite pentru următorii 5 ani?

Numeroase companii păstrează informaţiile sensibile pe infrastructura IT on premises, dar această tendinţă este pe cale să se schimbe. Într-un orizont de cinci ani, migrarea către o infrastructură IT mai distribuită, care să combine centre de date locale, edge şi cloud, se va accentua. Printre catalizatori: presiunea pe costuri, nevoia de procesare a datelor la sursă, apariţia unor tehnologii noi. Următorii cinci ani se anunţă foarte interesanţi, însă câte centre de date sunt pregătite pentru aceste schimbări? Culmea, cei mai neîncrezători sunt chiar operatorii, un studiu recent derulat de Forbes Insights arată că 11% dintre manageri şi doar 1% dintre inginerii din Centrele de Date consideră că facilităţile pe care le operează sunt la zi din punct de vedere tehnologic.

Un test de rezilienţă este şi pandemia curentă, care a pus la încercare nu doar capacitatea sistemelor medicale și administrative, ci și a centrelor de date. Marea majoritatea a Centrelor de Date au trecut cu brio acest examen dificil, demonstrând că întrunesc condițiile necesare includerii în categoria furnizorilor de servicii esențiale,  statutul de componentă critică în asigurarea continuității activității economice fiind unanim recunoscut. Totuşi, conform aceluiaşi studiu Forbes, „The Modern Data Center – How IT is Adapting To New Technologies And Hyperconnectivity“, Centrele de Date sunt în continuare îngrijorate în legătură cu problemele de   securitate (45%) și lăţime de bandă (43%). Probleme de actualitate și în prezent, dar nu singurele…

Self-healing, un subiect de actualitate

 

Un alt rezultat interesant – remarcabil mai ales prin prisma limitărilor impuse de pandemia de COVID-19 – este interesul crescut acordat subiectului „Self-Healing Data Centers“. 32% dintre managerii intervievați în cadrul studiului realizat de Forbes Insights au declarat că, până în 2025, mai mult de jumătate din centrele de date pe care le operează vor include capabilități de „Self-healing“, în timp ce 24% au ales funcționalitățile de tipul „Self-configuring“.

Cele două „deziderate“ completează conceptul de „Remote management“ LINK:  pe care tot mai multe centre de date au început să-l analizeze cu atenție după declanșarea pandemiei, respectiv după instituirea stărilor de urgență și a măsurilor de lockdown. Analiștii apreciază însă că, la momentul actual, destul de puține Data Centere au și capacități relevante dezvoltate în aceste sens. Excepțiile sunt reprezentate de micro-Data Centere, care – prin arhitectura containerizată și funcționalitățile avansate de automatizate integrate – beneficiază de un grad crescut de autonomie.

Criza de personal se adâncește

 

Interesul pentru centrele de date cu niveluri de automatizare cât mai ridicate nu se datorează însă doar limitărilor impuse de pandemie, ci și faptului că industria Data Center se confruntă de câțiva ani cu o criză globală de personal calificat. De citit pe acest subiect şi https://datacenter-forum.ro/creste-deficitul-de-specialisti-in-centrele-de-date/

Studiul citat arată că, până la finalul actualei decade, mai mult de o treime din forță de muncă care lucrează în domeniul centrelor de date va ieși la pensie. 40% dintre manageri și 37% dintre inginerii intervievați de Forbes au declarat că, în următorii 10 ani, se vor retrage din activitate. Acest fapt va duce la creșterea deficitului, semnalat încă de acum câțiva ani de Uptime Institute. Încă din 2018, 45% dintre managerii Data Centrelor estimau că lipsa de personal le va limita dezvoltarea în următorii cinci ani, iar 38% se confruntau deja cu dificultăti în găsirea de candidați calificați pentru pozițiile deschise.

 

Abordări pragmatice prin retehnologizare

 

Faptul că, la finalul anului trecut, aproximativ 90% din centrele de date nu considerau că sunt pregătite pentru a face față evoluției cerințelor pieței – fără a se fi confruntat cu noile provocări generate de pandemie – este în strânsă legătură cu ritmul de upgrade și retehnologizare al acestora. Este adevărat, 44% dintre Data Centerele care au participat la studiul Forbes au indicat faptul că realizează aceste procese în mod regulat. Însă numai 29% dintre ele au apreciat că update-urile tehnologice realizate le și acoperă nevoile. Sunt rezultate care furnizează informații relevante despre capacitatea actuală a centrelor de a valorifica tehnologii de viitor, precum 5G sau Edge Computing. Dar și despre faptul că marea lor majoritate se confruntă cu provocări importante pe zona îmbunătățirii eficienței energetice. Ca dovadă, managementul sistemelor de răcire reprezintă o problemă comună pentru mai multe de jumătate (53%) dintre subiecții studiului citat.

În aceste condiții – complicate și de evoluția imprevizibilă a pandemiei –, întrebarea din titlu nu poate căpăta un răspuns pertinent prea curând. Însă soluțiile concrete pentru că Data Centerele să fie pregătite pentru a înfrunta provocările viitoare exista deja.

Certificări pentru Centre de Date. Care sunt opţiunile principale?

Alinierea la standardele internaționale reprezintă o prioritate constantă a industriei centrelor de date, din ce în ce mai mulți clienți finali solicitând certificări care să garanteze disponibilitatea și calitatea serviciilor achiziționate.

Identificarea sistemului adecvat de certificare este însă dificilă pentru companiile nefamiliarizate cu standardele existente. Criteriile de clasificare și terminologiile diferă, iar zonele tehnologice acoperite (electro-alimentare, răcire, comunicații, securitate etc se suprapun. Și asta deoarece pe lângă „clasicele“ ISO 9001 (calitate), 27001 (securitate) și 14001 (mediu) sau seria dedicată ISO 30134 (indicatori de performanță pentru Data Centere), avem și SOC, HIPAA, PCI DSS, NIST 800-53, SSAE 16 etc. La acestea se adaugă însă și sistemele consacrate, cele mai populare în prezent fiind:

  • ANSI/TIA-942 – standard pentru infrastructura de telecomunicații, care utilizează un sistem de evaluare de tip „Ratings“;
  • Tier Standard – sistemul dezvoltat de Uptime Institute pentru certificarea centrelor de date din Statele Unite și exportat apoi cu succes la nivel internațional;
  • EN 50600 – „replica“ Comitetului European pentru Standardizare în Eletrotehnică (CELENEC), care folosește un sistem de „clase“.

Unii specialiști contestă însă includerea TIA-942 în top, invocând faptul că standardul este prea specializat, fiind focalizat strict pe zona de cablarea infrastructurii de comunicații. (Referirile la nivelurile de disponibilitate ale sistemelor de electro-alimentare și răcire apar „colateral“, doar în anexe, cu titlul de informare, nefăcând parte efectiv din standard.) Prin urmare, rămân în cursă sistemele dezvoltate de Uptime Institute și CELENEC, fiecare având propriile cu propriile avantaje competitive, pe care le vom prezența succint în rândurile ce urmează.

Atuurile sistemului Uptime Institute

Din punct de vedere al popularității, Tier Standard este lider. Conform datelor disponibile pe site-ul Uptime Institute, la momentul realizării acestui material erau emise peste 1.750 de certificări pentru centre din 105 țări. O scurtă incursiune pe harta centrelor certificate   relevă o serie de informații interesante:

  • România are, în prezent, un singur Data Center certificat (Transfond – Tier IV Certification of Design Documents).
  • Țările UE cu cele mai multe certificări sunt Spania (27), Italia (24) și Luxemburg (15).
  • La capitolul absențe notabile se remarcă Suedia, Finlanda și Estonia.
  • La nivel global, SUA deține supremația (178), urmată de China (95), Arabia Saudită (92), Brazilia (53) și Rusia (52).

Popularitatea Tier Standard se datorează, pe de o parte vechimii – peste 25 de ani pe piață –, iar pe de altă flexibilității sistemului. Uptime Institute utilizează o metodologie de evaluare a performanțelor centrelor și facilităților pe trei zone (Design, Constructed Facility și Operațional Sustainability), clasificându-le pe patru niveluri:

 

  • Tier I (Basic Capacity) – definește un Data Center dotat cu sisteme UPS și de răcire și generator electric pentru asigurarea protecției în cazurile întreruperilor accidentale de alimentare cu energie electrică.
  • Tier II (Redundant Capacity) – include componente redundante pentru sistemele critice de electro-alimentare și răcire (modul UPS, chillere, pompe, motoare de generatoare etc.).
  • Tier III (Concurrently Maintainable) – presupune asigurarea unei redundanțe de tip N+1, care să permită mentenanța și/sau înlocuirea echipamentelor fără perturbarea funcționării acestora.
  • Tier IV (Fault Tolerant) – presupune asigurarea unei redundanțe de tip N+2 și introduce conceptul de Fault Tolerance – atunci când survine un eveniment ce afectează funcționarea unui echipament sau livrarea unui serviciu critic, perturbarea este corectată automat.

(Mai multe detalii despre criteriile sistemului de clasificare Uptime Institute găsiți aici.) LINK: https://uptimeinstitute.com/tiers

Flexibilitatea invocată de partizanii Tier Standard constă în faptul că sistemul dezvoltat de Uptime Institute este unul progresiv – atingerea unui Tier superior se bazează pe respectarea condițiilor Tier-ului anterior. Pe de altă parte, sistemul indică doar rezultatele dorite, nu și modalitățile concrete prin care obiectivele de performanță pot fi obținute. Practic, sistemul Uptime Institute nu prescrie nicio tehnologie, design sau schemă specifică, dând astfel libertate centrelor de date în privința alegerilor făcute.

Care este abordarea EN 50600

Sistemul EN 50600 este conceput ca o suită de standarde, care se dezvoltă constant începând din 2013, la momentul realizării materialului incluzând următoarele componente:

  • EN 50600-1: General concepts
  • EN 50600-2-1: Building construction
  • EN 50600-2-2: Power distribution
  • EN 50600-2-3: Environmental control
  • EN 50600-2-4: Telecommunications cabling infrastructure
  • EN 50600-2-5: Physical security
  • EN 50600-3-1: Management and operational information
  • EN 50600-4-1: KPIs – Overview and general requirements
  • EN 50600-4-2: KPIs – Power Usage Effectiveness (PUE – ISO/IEC 30134-2);
  • EN 50600-4-3: KPIs – Renewable Energy Factor (REF ISO/IEC 30134-3);
  • EN 50600-4-4: KPIs – IT Equipment Energy Efficiency for Servers (REF – ISO/IEC 30134-3);
  • EN 50600-4-5: KPIs – IT Equipment Energy Utilisation for Servers (ITEEsv – ISO/IEC 30134-4)
  • EN 50600-4-5: KPIs – IT Equipment Energy Utilisation for Servers (ITEUsv – ISO/IEC 30134-5)
  • EN 50600-4-6: Energy Reuse Factor
  • EN 50600-4-7: Cooling Efficiency Ratio )
  • EN 50600-5-1: Data Center Maturity Model (Novated from Green Grid – In Development)
  • CLC/TR 50600-99-1: Energy management – Recommended Practices
  • CLC/TR 50600-99-2: Environmental sustainability – Recommended Practices
  • CLC/TR 50600-99-3: Guidance to the application of EN 50600 series

Deși este prezentat în prezent ca o suita de standarde, EN50600 nu a fost conceput inițial ca o metodă de evaluare, ci ca un ghid pentru centrele de date. Cu toate acestea, trei din componentele EN 50600 (2-2, 2-3 și 2-4) stabilesc niveluri de clasificare a centrelor de date în patru clase. Totodată, pentru Data Centerele care doresc să se alinieze cerințelor EN 50600, CLC Technical Committee 215 – entitate care colaborează cu CENELEC la dezvoltarea seriei de standarde – a publicat un ghid pentru corecta aplicare și interpretare a recomandărilor, CLC/TR 50600-99-3.

Deși seria este în dezvoltare încă – anul acesta au fost publicate EN 50600-4-6 și EN 50600-4-7 –, au început să apară tot mai multe entități terțe de certificare și centre de date care își anunță conformitatea cu anumite componente ale EN 50600. Ca de exemplu, providerul german InterNetX, centrul TelemaxX Telekommunikation  sau Data Centerul de stat de la Kragujevac, Serbia, cu o suprafață totală de 14.000 mp.

 

 

* Zona de telecomunicații nu este inclusă în sistemul de certificare Uptime Institute, pentru aceasta majoritatea centrelor de date folosind TIA942. EN 50600 include însă un sistem de ierarhizare pe patru clase: • 1. Single-path cu conexiune directă; • 2. Single-path cu utilizarea infrastructurii fixe și redundanță pe ENI (External Network Interface); • 3. Multi-path cu utilizarea infrastructurii fixe și redundanță pe ENI; • 4. Multi-path cu utilizarea infrastructurii fixe cu zone de distribuție redundante și redundanță pe ENI.

O abordare complementară

Un caz aparte îl reprezintă European Data Hub, din Luxemburg, care deține două certificări Uptime Institute (Tier IV Certification of Design Documents și M&O Stamp Of Approval), dar și certificarea EN 50600-2.

Nu este un caz singular – și centrul de date Basefarm, Norvegia, deține o certificare Uptime Institute (Tier III Certification of Design Documents), dar și EN50600 Availability Class 3.

Ceea ce demonstrează că abordarea Tier Classification versus EN 50600 este limitativă, cele două sisteme de certificare putând funcționa și complementar, fără se înlocui efectiv unele pe altele.

O astfel de abordare presupune însă competențe avansate în domeniul construcției Data Centerelor. De aceea, dacă doriți să aveți garanția că ați ales sistemul de certificare adecvat condițiilor specifice și nevoilor centrului de date pe care îl dețineți, specialiștii Tema Enegy vă stau la dispoziție.

Tema Energy – partener în proiectul Preţul Binelui

Tema Energy s-a alăturat Hope and Homes for Children România în proiectul Preţul Binelui care ajută copiii expuși riscului instituționalizării să rămână alături de familiile lor, oferindu-le acces la educatie si condiții de trai mai bune. Proiectul are ca obiectiv ca peste 1600 de copii care trăiesc în sărăcie, să nu ajungă în orfelinate, ci să rămână acasă, cu sprijinul companiilor partenere şi a donatorilor. Riscul ca aceşti copii să ajungă în instituţii a crescut considerabil în contextul pandemiei. Ambasadorul proiectului este binecunoscutul om de radio Mihai Morar. Programul are mai multe componente: conştientizarea opiniei publice ca de la sărăcie extremă la orfelinat este doar un pas, colectare de fonduri, distribuirea acestora şi ajutorarea efectivă a familiilor aflate in dificultate.

 

 

Hope and Homes for Children România derulează programe de prevenire a separării copilului de familie de aproape 20 de ani.  Mulţumită acestor acţiuni şi susţinerii din partea societatii, cca 35.000 de copii vulnerabili au rămas alături de părinți, si-au continuat studiile, au avut parte de ingrijire medicala adecvata si au beneficiat de programe de integrare socio-profesională.

Sunt interesate Centrele de Date să devină operatori de servicii esențiale?

Iminența instaurării unei noi stări de urgență – măsură luată în calcul de autorități pentru a atenua evoluția alarmantă a pandemiei de COVID-19 – readuce în prim-plan subiectul registrului de operatori de servicii esențiale (OSE) activi în România. Motivul este evident: pe parcursul stării anterioare de urgență, entitățile din categoria OSE au beneficiat de o serie de derogări de la măsurile limitative luate de autorități (privind derularea activității, deplasarea angajaților etc.)

Însă, conform raportului Comisiei Europene de evaluare a coerenței abordărilor adoptate de statele membre în procesul de identificare a OSE (în conformitate cu Directiva UE 2016/1148 privind securitatea rețelelor și a sistemelor informatice – așa-numita Directiva NIS), România avea la nivelul anului trecut doar 86 de entități încadrate la categoria OSE (spre deosebire de media europeană, care este de 633 operatori per stat membru). Iar dintre aceștia nu fac parte, în mod explicit, centrele de date, care au un rol esențial în derularea activității economice, atât în condiții de normalitate, dar mai ales în cazul readoptarii la nivel național a lucrului la distanță, respectiv de acasă.

Limitările Anexei II

 

Faptul că Data Centerele nu se regăsesc în Registrul Operatorilor de Servicii Esențiale – întocmit și gestionat de CERT-RO, entitate care se ocupă de identificarea și verificarea OSE – nu este o situație specifică doar României, ci se regăsește la nivelul întregii Uniuni Europene.

„Scăparea“ se datorează în bună măsură faptului că Directiva NIS emisă de Parlamentul European în iulie 2016 stabilește în formula sa inițială că OSE provin, în principiu, din șapte sectoare de activitate , nominalizate în Anexa II. În versiunea CERT-RO (disponibilă aici), acestea sunt:

 

 

  1. Energie (electrică; petrol, gaze);
  2. Transporturi (aerian, feroviar, pe apă, rutier);
  3. Bancar;
  4. Infrastructuri ale pieței financiare;
  5. Sectorul sănătătii;
  6. Furnizarea și distribuirea de apă potabilă;
  7. Infrastructuri digitale (Servicii IXP pentru traficul internet; Servicii DNS; Gestionarea registrului de nume de domenii .ro).

 

 

 

 

Acestora li se adaugă Furnizorii de Servicii Digitale (FSD) din trei categorii: piețe online, motoare de căutare online și servicii de Cloud Computing (conform Art. 3, Lit o).

Şi totuși, se poate mai mult

 

Faptul că Anexa II a fost aplicată mot-à-mot de statele membre se pare însă că este o greșeală care le aparține acestora. Articolul 5 alineatul (2) al Directivei stipulează trei criterii principale care trebuie utilizate generic identificarea OSE. Însă la alineatul (3) se prevede că statele membre trebuie să stabilească o listă cu serviciile esențiale pe baza acestor criterii, dar și că pot să depăsească sfera de aplicare a Anexei II și să efectueze o identificare în alte sectoare și subsectoare. Lucru pe care Ministerul Comunicațiilor și Societății Informaționale a încercat să-l facă în 2017, când a lansat în consultare publică modul de transpunere a Directivei NIS, incluzând în chestionar întrebarea: „Considerati că alte sectoare de servicii esențiale/digitale ar trebui să aibă obligații în ceea ce privește securitatea rețelelor și sistemelor informatice decât cele incluse în Anexele Directivei NIS? Care?“

Răspunsurile primite, conform raportului citat, au depășit cu mult nominalizările Anexei II, România identificând 77 de categorii de servicii esențiale. Adică mai mult decât dublu față de media europeană, care este de 35. (Singurii care ne-au depășit au fost polonezii, care au stabilit 87 de servicii esențiale.)

Cu toate acestea, forma finală a Legii nr. 362/2018 (care transpune Directiva NIS în legislația națională) așa cum a intrat ea în vigoare din ianuarie 2019, precum și Normele metodologice de identificare a OSE și FSD aprobate în iulie trecut nu includ decât sectoarele și subsectoarele menționate anterior. (Ghidul practic de identificare al OSE întocmit de CERT-RO este disponibil aici.)

 

CE revizuieste, CERT-RO se grăbește

 

Raportul Comisiei Europene de evaluare a coerenței abordărilor adoptate de statele membre (disponibil aici PDF în versiunea română) a analizat și aplicarea directivei în alte sectoare decât cele incluse în Anexa II.

Rezultatele obținute arată că statele membre participante au identificat 157 de OSE care furnizează servicii esențiale neincluse în rândul entităților menționate anterior. Iar primele dintre acestea sunt centrele de date și fermele de servere, urmate de serviciile financiare furnizate de societăți de asigurare și reasigurare și serviciile guvernamentale (servicii electronice pentru cetăteni).

În raport se mai arată că o serie de state membre au decis să profite de oportunitatea de a cuprinde și alte sectoare decât cele enumerate în Anexa II, măsură pe care o au în vedere și oficialii CERT-RO. Dan Cimpean, director general al Centrului, a precizat cu ocazia evenimentului Ziua Comunicațiilor că oficialii CE prevăd o revizuire a Directivei NIS pentru extinderea ariei de incluziune a categoriei OSE, dar și că măsurile pot fi grăbite de autoritățile române: „Prin Legea 362/2018 au fost desemnați Operatorii de Servicii Esențiale la nivelul României. Dar, în mod surprinzător, operatorii de telecomunicații nu intră în categoria OSE. Nu este vina legiuitorului român – Legea 362 este doar o transpunere a Directivei NIS în legislația națională –, însă pandemia ne-a demonstrat în mod clar că operatorii telecom sunt esențiali. Din fericire, Comisia Europeană prevede o revizuire a Directivei, dar cred că ar fi oportună adoptarea modelului altor țări care nu au mai așteptat și au luat la nivel național decizia de a desemna operatorii de telecomunicații a operatori de servicii esențiale.“

 

Statutul vine însă cu obligații

 

Este o informație utilă și industriei centrelor de date din România care, beneficiind de sprijinul autorităților, ar putea accede la statutul OSE, cu benficiile care decurg de aici. Însă, așa cum a precizat și directorul CERT-RO, recunoașterea vine la pachet cu o serie de responsabilități importante: de a reduce riscurile la minim, de a coopera cu furnizorii de echipamente și tehnologii și cu autoritățile pentru a identifică și contracara aceste riscuri, de a fi foarte transparenți în cazul incidentelor sau al existenței riscului unui impact asupra societății și economiei etc.

Conditiille de asigurare a securități rețelelor și sistemelor informatice prevăzute în Capitolul IV din Legea 362 includ cerințe minime de securitate, de notificare a incidentelor și de management al acestora. În afara acestora un întreg capitol (V) este dedicat auditului și autorizării OSE, iar un altul (VII) acțiunilor de supraveghere, control, sancționare. (link util https://cert.ro/pagini/informatii-generale-despre-nis găsiți mai multe informații generale utile.)

E foarte posibil ca acest cumul de condiții și prevederi să fie prea restrictiv pentru centrele de date din România. Dovadă, nici operatorii telecom nu se înghesuie să obțină statutul de OSE.

Însă, fie că vor deveni sau nu operatori de servicii esențiale, centrele de date locale vor trebui să adopte strategii adaptate contextului pandemiei, cum sunt, de exemplu, cele pe care vi lle-am recomandat deja pentru a pute asigura continuitatea operațională și nivelurile de performanță și calitate a serviciilor agreate cu clienții, fără a periclita sănătatea angajaților.

Cloudul Guvernamental, de la strategii la soluții concrete

 

În ultima perioadă, abundă anunțurile despre iminenta lansare a proiectului de Cloud Guvernamental. Știm deja că este pregătită o Hotărâre de Guvern, că există un buget de 45 de milioane de euro și chiar și un termen de finalizare, de maximum 24 de luni. Nu știm însă nimic despre infrastructura de Data Center din spatele proiectului Gov-Cloud, unde va fi localizat, ce nivel de disponibilitate și securitate va asigura, ce tehnologii de răcire vor fi folosite etc. Am analizat alte proiecte similare din UE și iată concluziile la care am ajuns.

În ultimele luni, Autoritatea pentru Digitalizarea României (ADR) a anunțat lansarea mai multor servicii pentru cetățeni, printre care și mult-așteptatul Cloud Guvernamental.

Gov-Cloud este o inițiativă mai veche a Uniunii Europene, la care statele membre au început să se alinieze încă de acum 10 ani. Dar la care România a fost constant codașă – de exemplu, conform unui raport ENISA din 2013, la acel moment ne încadram în categoria țărilor „ezitante“, care nu dețineau nici măcar o strategie în acest sens.

Între timp însă lucrurile s-au remediat – acum există deja un Proiect de Hotărâre de Guvern privind realizarea Cloud-ului Guvernamental  și – mai mult! – există și un buget de 45 de milioane de euro. Iar proiectul are și un termen limită de implementare de 24 de luni de la data semnării contractului de finanțare, potrivit declarațiilor făcute de Sabin Sărmaș, președintele ADR. Conform acestuia, principala menire a viitorului Gov-Cloud autohton este de a găzdui toate platformele existente în administrația publică, pentru a scăpa instituțiile și autoritățile publice din România de povara mentenanței propriilor infrastructuri hardware.

 

Cerințe critice de disponibilitate și securitate

 

Cloudul Guvernamental este, în mod evident, o inițiativă necesară și utilă la nivel național. Dar crearea unei infrastructuri Data Center capabile să livreze astfel de servicii vine „la pachet“ cu o serie de cerințe critice, în special pe zona de disponibilitate și securitate.

De exemplu, Centrul de Date de Stat din Serbia,  care oferă autorităților atât servicii de hosting, cât și de tip IaaS (Infrastructure-as-a-Service) – similare celor pe care ar trebui la furnizeze Gov-Cloud-ul local –, întrunește cerințele standardului Uptime Institute Tier 3+.

Pentru a atinge însă un asemenea nivel de disponibilitate a serviciilor, de minimum 99,9%, centrul de date respectiv trebuie să acopere o gamă extinsă de condiții. Care pornesc de la amplasare și design, până la dotarea cu soluții eficiente de electroalimentare și electro-backup, răcire, securitate fizică, detecție și stingere incendii. Și nu în ultimul rând cu sisteme de management centralizat, de tip DCIM, care să faciliteze realizarea de intervenții de la distanță și abordări de tipul „remote management“, utile mai ales în actualul context pandemic.

 

Soluții adaptate cerințelor specifice

 

Fiecare dintre aceste cerințe reprezintă, în sine, o provocare.

De exemplu, în România există un număr limitat de specialiști acreditați Uptime Institute. Dar nu numai – și numărul experților certificați, cu experiență în construirea centrelor de date și cu abilități muți-vendor este scăzut. (Mai multe detalii despre acest deficit acut găsiți aici.

Apoi, puține companii dețin intern competențe pe zona de electro-alimentare și, mai ales, pe cea de electro-backup. Ori penele de curent sunt evenimente curente în România, iar 37% dintre downtime-urile neplanificate sunt cauzate de defecțiunile sistemelor de alimentare cu energie electrică – conform Uptime Institute. Într-un astfel de context este evidentă nevoia de sisteme redundante de electroalimentare și electro-backup de tip N+1 sau chiar N+2 având în vedere nivelul de criticitate al serviciilor furnizate.

Asigurarea redundanței este necesară și în cazul arhitecturilor de răcire – România înregistrează în ultimii ani o creștere constantă a temperaturilor medii pe perioada de vară. Impactul încălzirii globale se face simțit mai ales în București, oraș care concentrează cele mai multe centre de date din România și unde numărul zilelor cu temperaturi de peste 30ºC a trecut de 40 pe an. În acest caz, ținând cont de faptul că sistemele de răcire tradiționale sunt responsabile pentru 40% din valoarea facturii de energie electrică, specialiștii recomandă utilizarea soluțiilor complementare de Free Cooling și de răcire adiabatică/evaporativă.

Toate aceste cerințe – alături de cele de securitate fizică și de detecție și stingere a incendiilor sunt uzuale pentru centrele de date care furnizează servicii de Cloud Guvernamental. Acoperirea lor nu este facilă, dar nici imposibilă atunci când se apelează la resurse cu experiență relevantă în domeniul industriei Data Center.

Remote management în Data Center, de la „Nice to have“ la „Must have“

Timp de mai mulți ani, conceptul de „Remote management“ a fost, pentru marea majoritate a centrelor de date doar o idee interesantă. Pandemia de COVID-19 a transformat-o într-o necesitate imediată. Însă pentru multe Data Centere trecerea de la stadiul „Nice to have“ la „Must have“ este un proces de durată.

E un fapt confirmat și de sondajul realizat de Mark Acton, un „guru“ al industriei Data Center care a dorit să afle cât de pregătiți sunt managerii centrelor să pună în aplicare modelul „Remote“, la câteva luni de la declanșarea pandemiei. Rezultatul a fost previzibil – în prezent foarte puține Data Centere dețin mijloacele care să le permită să gestioneze complet de la distanță facilitățile pe care le operează. Modelul „Lights out“, adică fără niciun angajat prezent la față locului, nu se poate aplica decât în cazul micro-Data Centerelor containerizate și complet automatizate. Și nici acolo complet.

Marea majoritate a centrelor și-au adatat modul de lucru la „cerințele“ pandemiei, utilizând intensiv în acest scop sistemele de tip DCIM,  precum și alte soluții de monitorizare, control și prevenție, fără a renunța însă la echipele operaționale. Iar modelul s-a dovedit nu doar funcțional, ci și eficient, nesemnalându-se până în prezent niciun caz de Data Center care să își fi întrerupt definitiv activitatea și nici de „Lockdown“.

Pe baza experiențelor cumulate de industria Data Center la nivel global, încep să se contureze o serie de bune practici, utile mai ales în contextul unui posibil reviriment al pandemiei. Iată, pe scurt, care sunt cele mai frecvente 5 măsuri adoptate de centrele de date pentru a preîntâmpina și limita efectele negative ale virusului SARS-CoV-2:

 

  • Creștere eficienței sistemelor de igienizare și protecție. Resursa umană este cel mai prețios capital. Însă, pe lângă dotarea angajaților cu echipamente de protecție, soluții de verificare a temperaturii, sisteme de igienizare, stabilirea de rute speciale de deplasare pentru a evita aglomerarea etc., multe centre de date au investit, de exemplu, și în extinderea acoperirii soluțiilor de supraveghere video în interior. Astfel, pot realiza o monitorizare mai strictă a angajaților, dar permit și clienților să poată controla vizual starea de funcționare a echipamentelor găzduite. De asemenea, numeroase Data Centere și-au îmbunătățit sistemele de securitate fizică din exteriorul clădirii, precum și cele de control acces. Există, de exemplu, companii care au înlocuit soluțiile de autentificare prin amprentă cu altele mai puțin riscante, cum ar fi scanere de rețea vasculară a mâini, care realizează operațiunea de la distanță. O altă zonă de interes pentru tot mai multe centre de date o reprezintă și sistemele de detecție și prevenire a incendiilor, stringent necesare pentru a compensa reducerea personalului operațional în cazul unui eveniment de acest tip.

 

  • Reducerea personalului prezent în Data Center. Pentru a se conforma cerințelor de distanțare fizică, multe centre de date au adoptat lucrul la distanță – acolo unde este posibil – și extinderea sistemului de lucru în schimburi, care nu reprezintă o noutate, asigurarea disponibilității serviciilor 24x7x365 fiind o condiție esențială pentru funcționarea unui Data Center. Pandemia a impus însă acordarea unei atenții sporite protejării resursei umane specializate – specialiștii în domeniu sunt puțini, piața se confruntă deja cu un deficit major, așa că intervențiile acestora sunt reduse pe cât posibil, atât ca timp, cât și ca număr. Pentru ca acest lucru să fie posibil, centrele folosesc pe scară extinsă sistemele DCIM pentru a depista și rezolva din timp potențialele probleme care ar putea afecta funcționarea echipamentelor.

 

  • Limitarea accesului vizitatorilor. Restrângerea prezenței clienților în incintă reprezintă o problemă delicată mai ales pentru centrele de colocare. Pentru a o rezolva, tot mai multe Data Centere oferă clienților acces la soluții de monitorizare în timp real (atât video, cât și de urmărire a parametrilor de funcționare). Dar și la servicii de tip „Remote hands-on“, prin care operațiunile uzuale sunt realizate de angajații centrelor sub controlul direct al clienților. (Există, de exemplu, centre care pentru a încuraja adoptarea acestui mod de lucru prestează gratuit anumite categorii de intervenții.) Nu în ultimul rând, toate centrele au adoptat sisteme de planificare a vizitelor clienților, pentru a evita posibilele aglomerări.

 

  • Investiții în tehnologie. Pandemia a făcut din sistemele DCIM o necesitate evidentă, devenind vitale în luarea deciziilor bazate pe informații în timp real și pentru creșterea eficienței echipelor operaționale. Nu sunt însă singurele direcții de investiții – reducerea personalului operațional impune și îmbunătățirea eficienței soluțiilor de răcire, de electro-backup etc. Lucru posibil prin retehnologizare. De exemplu, soluțiile de răcire de nouă generație includ funcționalități avansate de analiză, care, pe baza istoricului datelor de consum și a monitorizării parametrilor de funcționare, pot semnala automat posibilitatea apariției unei defecțiuni și când trebuie realizate operațiunile de mentenanță predictivă. Similar, UPS-urile Li-Ion integrează sisteme de monitorizare avansate (Battery Monitoring Systems), care oferă informații detaliate despre durata de viață a bateriei. Investițiile în tehnologie au devenit necesare însă și pentru a asigura un nivel minim de redundanță (de tip N+1) pentru sistemele critice, multe centre anlizând și opțiunile N+2.

 

  • Îmbunătățirea comunicării. Pandemia obligă centrele de date să acorde o mai mare atenție comunicării atât cu clienții – pentru a le prezenta măsurile luate și soluțiile pe care le au la dispoziție –, cât și cu partenerii tehnologici. Restricțiile de transport impuse de anumite state pot genera întârzieri de proporții în livrarea echipamentelor și sunt dificil de prevăzut, de aceea este nevoie de menținerea unei legături constante cu furnizorii și integratorii de sistem, pentru a preîntâmpina pe cât posibil sincopele. Un alt treilea partener important de comunicare au devenit și autoritățile publice, deoarece restricțiile de deplasare impuse pe durata perioadelor de urgență pot afecta funcționarea centrelor de date. Nu însă și dacă acestea sunt încadrate, așa cum este firesc, în categoria infrastructurilor critice, beneficiind de un regim special.

 

Va mai dura ceva timp până când centrele de date vor fi complet automatizate, de aceea măsurile prezentate succint mai sus și investițiile în tehnologii mai performante și în soluții de protejare și creștere a eficienței operaționale a angajaților sunt necesare. Și își vor demonstra eficiența pe termen lung, pentru că pandemia va avea un impact permanent asupra industriei Data Center.

Raport 2020: Care sunt principalele cauze de downtime în Centrele de Date

Într-o economie marcată de cloud şi digitalizare, IT-ul este vital pentru operațiunile oricărei companii. Aceasta face ca riscul de downtime în centrele de date să devină un potenţial coşmar, prin costurile financiare şi de imagine pe care le generează. Cât de frecvente şi de grave sunt însă „defecţiunile” în industria DataCenter, unde atenţia acordată redundanţei şi continuității atinge în general un nivel ridicat?  Un răspuns poate fi găsit în ediţia  2020 a chestionarului anual (link la finalul articolului) realizat de Uptime Institute: 78% dintre organizații afirmă că au suferit o întrerupere accidentală a serviciilor IT (proprii sau ale unui furnizor extern) în ultimii trei ani, dar că 41% dintre acestea  au avut un impact minim sau neglijabil. Totuşi, în 31% dintre cazuri căderea sistemelor IT a generat pagube financiare şi a afectat reputația companiilor respective.

 

Scade severitatea, creşte incidenţa

 

Prin comparație cu anii precedenți, analiza Uptime surprinde o creştere generală a numărului de incidente,  dar şi o scădere a severităţii acestora. Incidentele au fost grupate pe cinci categorii (Neglijabile, Cu impact minim, Semnificative, Serioase şi Severe) iar rezultatele chestionarului au arătat o  reducere a numărului de  întreruperi severe (de la 8% în 2019 la 6% în 2020) însă o uşoară creştere a incidentelor „semnificative şi serioase”, de la 33% la 38%, în timp ce ponderea incidentelor minore a rămas oarecum constantă. Interesant este că majoritatea respondenţilor (75%) consideră că cele mai recente incidente puteau fi prevenite şi că au înţeles ce greşeli au făcut şi ce putea fi îmbunătățit. Prin urmare,  cu investiţii mai consistente în management, tehnologie, procese şi training, Centrele de Date ar putea diminua semnificativ frecvenţa şi gravitatea incidentelor.

Care sunt cauzele?

Cunoaşterea şi înţelegerea cauzelor unui downtime sunt esenţiale  pentru eliminarea efectelor şi adoptarea celor mai potrivite măsuri de prevenție, inclusiv direcționarea corectă pe termen lung, a investițiilor în tehnologie. De cele mai multe ori, astfel de concluzii rămân însă necunoscute publicului, mass media reflectând doar efectele vizibile, care afecteaza utilizatorii. Sondajul Uptime a inclus şi întrebări despre cauzele primare ale incidentelor grave. Răspunsurile arată că cele mai mari probleme apar  în urma defecțiunii sistemelor de alimentare cu energie electrică (37%). Următoarele locuri sunt ocupate de incidentele la nivel de software/sisteme IT (22%), rețea (17%) şi sisteme de răcire (13%). În 1% dintre cazuri, companiile implicate nu au aflat niciodată ce a cauzat întreruperea serviciilor IT.

 

Analiza Uptime nu diferențiază între defecțiuni tehnice, cauze externe (atacuri cibernetice, spre exemplu) şi erori umane apărute la instalarea, configurarea, actualizarea sau mentenanța unor sisteme.  Conform Ponemon Institute, în cel puţin 22% dintre cazurile de întreruperi accidentale, elementul declanșator a fost o eroare umană. Erorile umane pot fi prezente chiar şi în organizații cu proceduri foarte ferme, cel mai relevant exemplu fiind incidentul din 2017 de la Centrul de Date Amazon. Atunci, un membru al echipei a executat greşit o comandă de actualizare a sistemului de facturare, iar reacţia în lanţ a dus la căderea parțială a serviciilor S3 pentru câteva ore.Pentru detalii accesaţi  https://www.datacenterdynamics.com/en/news/amazon-web-services-s3-outage-due-to-human-error/

Chiar dacă incidentele determinate de software şi rețea au devenit mai frecvente şi nu sunt uşor de identificat, eliminarea cauzelor primare nu este totuşi costisitoare. Pe de altă parte, problemele legate de electroalimentare sunt însă în general mai grave şi implică investiții mult mai consistente  pentru revenirea la normal, inclusiv retehnologizare. Situaţia este similară şi pentru incidentele determinate de probleme hardware, a căror înlocuire este costisitoare şi durează. Acest tip de incidente poate deveni mult mai acut în următorii ani, pe măsură ce tot mai multe companii prelungesc intervalul de înlocuire a echipamentelor IT. Dacă în 2015, 37% dintre companii înlocuiau un server în medie la 3 ani şi 20% la cinci ani, astăzi procentele sunt aproape invers: 50% dintre companii schimbând serverele  la cinci ani sau mai mult.

 

Creşterea gradului de vigilență

 

Indiferent de volumul investiţiilor în redundanţă şi disponibilitate, concluzia analizei Uptime este că testarea permanentă a nivelului de reziliența este cheia. Specialiștii recomandă nu doar numirea unui responsabil, cât mai ales testarea efectivă a tuturor sistemelor, deoarece sondajul anual din 2020 a arătat că 21% dintre companii desi au  numit formal o echipă care să gestioneze aspectele de reziliență a serviciilor, nu reușesc să execute un plan constant de testare. Totuși, sondajul Uptime atestă că în 44% dintre cazuri cele două elemente converg, existând atât un responsabil cât şi testări periodice.

 

Situaţia locală

 

În România doar cazurile foarte grave de întrerupere a serviciilor IT ajung publice. Povestea unui Centru de Date care publica pe site, la începutul anului, raportul unui incident şi recunoştea problemele de conectivitate apărute, este doar o excepţie.  Majoritatea companiilor nu comunică astfel de subiecte şi preferă să ignore problemele generate de nefuncţionarea sistemelor IT.  O simplă căutare pe Google arată  numeroase ştiri de spre bancomate şi POS-uri, precum şi diverse servicii publice online nefuncționale în diverse perioada ale anului curent. Chiar dacă sunt prezentate efectele şi nu cauzele, cu siguranţă în multe situaţii incidentele au la baza probleme ale infrastructurii IT. De asemenea, întreruperile accidentale ale alimentării cu energie electrică au rămas la fel de frecvente, chiar dacă nu atât de intense, ca în anii trecuţi. În Bucureşti, pana de curent din 7 august, care a durat aproape o oră,  afectat numeroase companii şi instituţii din trei sectoare, inclusiv clădirea Guvernului. https://economie.hotnews.ro/stiri-energie-24217164-pana-masiva-curent-bucuresti-cladirea-guvernului-ramas-fara-electricitate.htm Nu doar sistemul de semaforizare şi staţiile de pompare a apei au fost oprite, ci şi camerele de servere care erau lipsite de redundanţă pe alimentarea cu energie electrică. Cât costă o oră din activitate a unui angajat, dar a unei companii?  O evaluare ar fi justificată, deoarece întreruperile serviciilor IT generează, în mod evident, pierderi financiare şi de imagine, însă necunoscând aceste pagube, doar puţine companii investesc serios în redundanţă şi disponibilitate.

Studiul Uptime este disponibil la https://uptimeinstitute.com/2020-data-center-industry-survey-results, necesită înregistrare.

Cummins se implică în producția de măști respiratorii N95

Cummins a anunțat încheierea unui acord de colaborare cu compania DuPont pentru a veni în sprijinul producătorilor de măști respiratorii de tip N95. Anunțul a fost făcut după ce în luna martie Universitatea din Minnesota a realizat un prim prototip al unei măști care utiliza produsele Cummins NanoNet și NanoForce, dezvoltate pe baza tehnologiei Hybrid Membrane Technology (HMT) deținute de DuPont, și care sunt utilizate în sistemele de filtrare ale motoarelor Diesel de mare capacitate. Cummins a anunțat că lucrează îndeaproape cu autoritățile care se ocupă de testarea și certificarea produselor medicale și își pregătește facilitățile de producție pentru a face față cererii.

Parteneriat Riello-RWE în domeniul partajării energiei

Companiile germane RWE și Riello au încheiat un parteneriat în scopul dezvoltării unui sistem care să permită partajarea energiei stocate în echipamentele UPS prin intermediul rețelelor naționale atunci când apar situații care necesită astfel de măsuri. Produsul, intitulat Master+, permite centrelor de date să stocheze energia într-un echipament dotat cu o baterie „Premium“ cu o capacitate considerabil mai mare decât cea a unui UPS obișnuit. Un prim client al noii soluții este Kraftwerks-Simulator-Gesellschaft mbH (KSG), un centru de simulare din Essen care oferă servicii de training pentru operatorii nemți și olandezi de centrale nucleare.

Galaxy VS, un UPS trifazat cu baterii inteligente

Schneider Electric a prezentat recent prima versiune a Galaxy VS un echipament de tip UPS trifazat, cu module de baterii interne inteligente. Galaxy VS 10-50 kw asigură disponibilitate crescută și flexibilitate sporită în configurarea bateriilor, care sunt dispuse sub formă de șiruri redundante și dispun de funcții de auto-configurare și monitorizare. Noul model are o amprentă la sol redusă, prin integrarea bateriilor în unitatea UPS, asigură disponibilitate maximă datorită arhitecturii modulare (care permite un service mai rapid) și asigură un timp de funcționare sporit. Galaxy VS este un produs EcoStruxure Ready, fiind ușor de gestionat cu ajutorul soluțiilor de management de nouă generație EcoStruxure IT Expert și EcoStruxure Asset Advisor.