Kontakt

Strona główna


IKONA Hot Line
Prawidłowe prowadzenie usługi utrzymania ruchu ma na celu zminimalizowanie ryzyka zatrzymania dostępu do usług świadczonych przez infrastrukturę krytyczną (np. przetwarzanie danych w serwerowniach, świadczenie statutowej działalności w administracji państwowej, dostęp do usług finansowych banku, zapewnienie bezpiecznego ruchu lotniczego na lotniskach, itp) w wyniku:

  • braku właściwego nadzoru pracy urządzeń i systemów,
  • braku ciągłości wykonywania czynności serwisowych urządzeń i systemów,
  • wystąpienia aprzerwy zasilania podstawowego lub pomocniczego,
  • niekontrolowanego wzrostu temperatury lub wilgotności ponad dopuszczalne poziomy,
  • niekontrolowanego lokalnego przegrzania, zalania, zapylenia, zadymienia lub innych zdarzeń będących następstwem niewłaściwej eksploatacji infrastruktury krytycznej.
  • błędów w wykonywaniu procedur eksploatacyjnych lub awaryjnych.

Infrastruktura Krytyczna 2Służby techniczne utrzymujące ruch, posiadające właściwe uprawnienia techniczne, w tym sanitarne i elektroenergetyczne w zakresie eksploatacyjnym i dozorowym, oraz inne uprawnienia wymagane obowiązującymi przepisami prawa; powinny realizować utrzymywanie Infrastruktury technicznej w pełnej sprawności poprzez utrzymywanie założonych parametrów technicznych, eksploatacyjnych i wydajnościowych określonych przez Mierniki Funkcjonalności zapisane w parametrach świadczonej usługi, czyli w wymaganiach SLA (Standard Level Agreement).

Służby techniczne są zobowiązane do takiego zarządzania infrastrukturą techniczną o znaczeniu krytycznym (np.:  przyłączami doprowadzającymi energię, rozdzielnicami nn i SN, agregatami prądotwórczymi, zbiornikami paliwa, UPS-ami, szynoprzewodami zasilającymi, rozdzielnicami dystrybucyjnymi IT, rozdzielnicami obsługującymi systemy klimatyzacji dla pomieszczenia serwerów i pomieszczeń technicznych UPS, agregatami chłodniczymi, szafami klimatyzacji precyzyjnej, instalacją i armaturą wody lodowej, instalacją detekcji dymu, instalacjami gaśniczymi) i podejmowania takich działań, które będą przeciwdziałać ryzyku zaistnienia zdarzeń zagrażających ciągłości dostępu do usług świadczonych przez tą infrastrukturę krytyczną.

Dlatego, służby techniczne muszą posiadać odpowiednie zdolności organizacyjne i etatowy personel własny w odpowiedniej obsadzie odpowiadającej rzeczywistemu pokryciu wymaganych godzin pracy, zgodnie z wymaganym poziomem usługi SLA, właściwe doświadczenie i kompetencje, wymagane uprawnienia i certyfikaty producentów.

Służby techniczne powinny być zorganizowane w ten sposób aby sprostać wymaganym czasom reakcji, czasom naprawy i czasom naprawy ostatecznej ustalonych w zależności od priorytetu działania uszkodzonego elementu infrastruktury technicznej o znaczeniu krytycznym. Dlatego krytycznym jest również udokumentowany, natychmiastowy dostęp do właściwych części zamiennych i urządzeń konicznych na czas wykonania naprawy ostatecznej lub awaryjnej tymczasowej zgodnie z SLA.

Służby techniczne muszą działać w oparciu odpowiednie procedury i harmonogramy w zakresie nadzoru urządzeń, przeglądów bieżących, remontów bieżących i remontów prewencyjnych oraz sytuacjach awaryjnych w zależności od typu systemu i urządzeń. Procedury mają zapewnić maksymalnie uproszczony dostęp do wszelkich zasobów i informacji niezbędnych dla prawidłowo wykonywanej usługi utrzymania ruchu oraz wszelkich czynności, których wynikiem jest dotrzymanie wymaganego poziomu SLA, w tym m.in:

  1. zapewnienie na obiekcie odpowiedniego całodobowego nadzoru nad pracą Infrastruktury technicznej w tym:
    • ciągłego monitorowanie stanu,
    • nadzór urządzeń i instalacji dokonywany podczas rutynowych obchodów,
    • wykonanie planu awaryjnego na wypadek braku możliwości zapewnienia ciągłości wykonywania czynności serwisowych;
  2. utrzymanie stałej gotowości do wykonania interwencji serwisowej 365/24 przez personel własny posiadający wymagane certyfikaty i odpowiednie uprawnienia, wiedzę i doświadczenie oraz wykonanie planu awaryjnego na wypadek braku możliwości wykonania wymaganych czynności serwisowych siłami własnym w czasie określonym w SLA;
  3. bieżącą analizę danych i trendów z zainstalowanych systemów monitorujących i rejestrujących oraz kontrolę i weryfikację ze stanem faktycznym poprawności wydruków i raportów generowanych przez systemy monitoringu i nadzoru;
  4. zapewnienie toru zasilania energetycznego o wymaganych parametrach z co najmniej jednej strony oraz temperatury i wilgotności odpowiedniej dla każdego urządzenia zainstalowanego w komorach serwerowych, węzłach telekomunikacyjnych i pomieszczeniu systemów bezpieczeństwa;
  5. utrzymanie ciągłości dostaw paliwa i zagwarantowanie wymaganego poziomu paliwa w zbiornikach zasilających agregaty prądotwórcze (na poziomie co najmniej określonego poziomu np. 75% w stanie gotowości i powyżej określonego minimum - np. 25% podczas ich pracy ciągłej) 365/24;
  6. wymianę podzespołów, części zamiennych i materiałów eksploatacyjnych oraz utylizację odpadów niebezpiecznych powstałych z maszyn, urządzeń, systemów i instalacji energetycznych;
  7. ciągły, stały dozór nad aktualizacją i weryfikacją dokumentacji technicznej;
  8. ciągłą weryfikację właściwych nastaw i progów alarmowych dla parametrów krytycznych w miarę wprowadzanych zmian w infrastrukturze IT;
  9. Power supply10zapewnienie właściwej funkcjonalności instalacji elektroenergetycznych i sanitarnych, pracujących na potrzeby komór serwerowych w tym dokonywanie przeglądów, napraw maszyn i urządzeń w wymaganych terminach, oraz podejmowanie działań mających na celu utrzymanie Infrastruktury technicznej w stanie pełnej sprawności poprzez przeprowadzanie planowych Kontroli, Konserwacji i Przeglądów okresowych; w tym:
      • wdrożenie i stałe uzupełnianie szczegółowych instrukcji i procedur eksploatacyjnych i awaryjnych w zakresie obsługi bieżącej, wystąpienia sygnałów świadczących o możliwości wystąpienia awarii w infrastrukturze technicznej, procedur na wypadek wystąpienia różnych typów awarii oraz planowania i wykonywania remontów i modernizacji;
      • utrzymywanie systemów i urządzeń w stanie gwarantującym ich ciągłą sprawność eksploatacyjną poprzez utrzymywanie urządzeń w stanie „jak nowe”.
      • właściwe i terminowe wykonywanie czynności serwisowych, bieżącej obsługi, specjalistycznych przeglądów okresowych i prewencyjnych oraz wykonywanie wszelkich specjalistycznych napraw awaryjnych maszyn, urządzeń, instalacji i systemów, w tym także badań okresowych Infrastruktury technicznej wymaganych polskim prawem;
      • bieżące usuwanie usterek , urządzeń, instalacji i systemów oraz wykonywanie wszelkich napraw maszyn, urządzeń i instalacji;
      • wykonywanie co najmniej cztery razy w roku prób gotowości Infrastruktury technicznej do zaników zasilania, testu agregatów pod pełnym obciążeniem,
      • dokumentowanie i informowanie o wystąpieniu wszelkiego typu nieprawidłowości w pracy lub stanie urządzeń;
      • przygotowywanie raportów, w tym: raportów o stanie Infrastruktury i wykorzystaniu zasobów, raportów z wykonanych prac i wykorzystanych materiałów, raportów z awarii lub incydentów oraz analiz przyczyn ich wystąpienia (dokumentacja diagnostyczna, raporty z czynności serwisowych, raporty monitoringu, ekspertyzy zewnętrzne);

 

 

Przyczyny incydentów

73% wszystkich przerw w dostępie do infrastruktury będących następstwem utraty funkcjonalności, jest skutkiem bezpośrednich błędów ludzkich.

Zasada 5xP

stanowi filar profesjonalnej usługi utrzymania ruchu opartej o zasadę zapewnienia „Funkcjonalności Infrastruktury Technicznej o znaczeniu krytycznym”

Utrzymanie ruchu

Zapewnienie ciągłego ruchu jest następstwem pracy szeregu służb oraz zależy od wielu czynników, będących często poza kontrolą tych służb.

Utrata funkcjonalności

Baza raportów z awarii Uptime Instytut podaje, że głównymi przyczynami utraty funkcjonalności są braki w zarządzaniu, działania personelu obsady i błędne procedury operacyjne.

Skutki incydentów

Według źródeł UPTIME Institute, w roku 2014, minuta barku dostępu do infrastruktury IT w serwerowni sięgała 8000 USD (w Polsce brak danych na ten temat).

Serwerownie info o autorze

  
O administratorze serwisu

 

Absolwent Akademii Morskiej w Gdyni na wydziale budowy eksploatacji siłowni okrętowych. Posiada ponad 20-letnie doświadczenie w systemach nadzoru instalacji technicznych. Swoje doświadczenie zdobywał w pracy w międzynarodowych koncernach: Honeywell, Schneider Electric i Johnson Controls. Pasjonat procesu zapewnienia funkcjonalności jak również podnoszenia efektywności energetycznej i budownictwa zrównoważonego.

FOIL ATS736 Wrobel 140710 cmyk

Posiada akredytację Uptime Institute nr.736 

W przypadku pytań: Ten adres pocztowy jest chroniony przed spamowaniem. Aby go zobaczyć, konieczne jest włączenie w przeglądarce obsługi JavaScript.poczta1