Čo je monitorovací systém(MS)?
Sú to hardvérové a softvérové systémy zamerané na sledovanie vybraných parametrov serverov, počítačov, siete, webstránky a iných prvkov IT infraštruktúry. Keď sledované ukazovatele prekročia zadefinované hodnoty alebo sa odchýlia od normálu tak systém automaticky notifikuje špecialistov technickej podpory FixIS.
Prečo IT infraštruktúra potrebuje monitorovací systém (MS)
MS riešia dve hlavné úlohy:
Upozornenie špecialistov technickej podpory pri akejkoľvek anomálií v IT infraštruktúre s cieľom predísť incidentom. Incidenty sa zvyčajne delia na:
Poruchy, ktoré spôsobia spomalenie systému alebo jeho úplný výpadok. Príkladom výpadku je prehriatie procesora, ktoré spôsobí výpadok a zastavenie služieb.
Bezpečnostné hrozby ako napríklad pridanie užívateľských práv do zabezpečeného priečinka, do ktorého by žiadny užívateľ nemal mať prístup.
Poskytuje štatistiku alebo záznamy zmien parametrov v systéme čo umožňuje efektívnu správu a starostlivosť o systém.
Príkladov prečo je monitorovací systém kuriálnou súčasťou každej IT infraštruktúry je mnoho. Napríklad v prípade vyčerpania voľného miesta na disku s operačným systémom alebo databázami prestane server fungovať. Obnova systému môže trvať aj niekoľko hodín, počas ktorých sa prerušia všetky služby, ktoré tento systém vykonával. Ak má však daný server nastavený monitoring tak pri prekročení určitej hranice zostávajúceho voľného miesta vyšle upozornenie. Špecialista, ktorý je za systém zodpovedný tak bude môcť proaktívne zasiahnuť a prijať opatrenia, ktoré zabránia núdzovej situácií, ktoré by mohli firmu spomaliť alebo ohroziť. Ďalším príkladom využitia monitorovacieho systému je diagnostika hardvéru servera s periodickým alebo konštantným zamrznutím. IT špecialista FixIS si ta bude môcť zanalyzovať nazbierané dáta o jadrách procesorov, RAM alebo úložísk a identifikovať tak možné príčiny problémov. Namiesto výmeny celého servera sa tak bude môcť postupovať precíznejšie a adresnejšie. Nájdu sa konkrétne programy alebo služby, ktoré nevyužívajú výpočtový výkon a kapacitu servera efektívne a vyrieši sa tak podstata problému nie jeho symptómy. Takýto prístup šetrí našim klientom mnoho času a prostriedkov.
Čo sleduje Monitorovací systém?
Zbiera a zaznamenáva informácie o prevádzke požadovaných prvkov IT infraštruktúry a služieb vrátane operačných systémov MS Windows, Linux, Unix, periférnych zariadení, sieťových prvkov alebo IP telefónov. Na interakciu so zariadeniami sa používajú natívny agenti a protokoly SNMP a IPMI.
Príklady štandardných parametrov a ukazovateľov:
Zistené parametre (približné) | Reakcia špecialistu po prvom upozornení | Čo možno vyčítať z analýzy záznamov |
Problémy s hardvérom | ||
Voľný priestor na úložisku <10% | Identifikovať čo zaberá nadmernú kapacitu, premazať nepotrebné dáta poprípade rozšíriť kapacitu úložiska | Ak sa úložisko zaplnilo nezvyčajne rýchlo tak sa identifikuje aplikácia, ktorá tento jav spôsobila a hľadá sa príčina anomálie |
Kapacita RAM <10% | Analýza spustených procesov a využitej kapacity RAM. Vypnúť chybné procesy respektíve rozšíriť kapacitu RAM | Identifikácia období kedy dochádza k vyťaženosti RAM. Ak to nie je v časoch kedy by to vyťaženiu zodpovedalo tak treba zamerať pozornosť na vyhľadávanie trójskych koňov alebo iný malware bežiaci na pozadí. Taktiež treba zanalyzovať správnosť naplánovaných úloh |
Teplota základnej dosky alebo iného komponentu je vyššia ako je zadefinované | Vyčistiť aktívne aj pasívne chladenie, vymeniť tepelnú pastu poprípade vymeniť pokazené chladenie | Náhly a neštandardný nárast teploty indikuje problém s chladením. Chladenie sa musí bezodkladne opraviť aby sa predišlo zlyhaniu komponentov výpočtovej techniky |
Priemerné využitie CPU> 80% za 30 minút | Zobraziť spustené aplikácie a ich podiel využitia výpočtového výkonu procesora. Môže sa jednať o trójskeho koňa alebo nesprávne načasovanie náročných plánovaných úloh na rovnaký čas. | Zanalyzovať či sa časy, v ktorých sú zaznamenané vysoké vyťaženia hardvéru zhodujú s časmi vysokého pracovného zaťaženie. Ak nie tak je potrebné hľadať malvér alebo zoptimalizovať časovanie plánovaných úloh |
Fronta pevného disku > 1 zápis za 5 minút | Fronta indikuje počiatočné problémy s výkonom. Malo by sa zistiť, ktorá aplikácia potrebuje robiť zápis na disk. Ak to nie je zapríčinené zásahom administrátora tak je vhodné zvážiť modernizáciu diskového subsystému. | Zvýšené zaťaženie naznačuje nedostatočnú rýchlosť - štatistika využívania disku napomáha pri rozhodovaní o jeho modernizácií. |
Sledovanie BSOD | Analýza porúch, odstránenie príčiny | Časté BSOD hovoria o nestabilite hardvéru alebo softvéru. Vyžaduje sa ich výmena a dôsledné monitorovanie. |
Chyby a kritické udalosti radiča RAID | Nevyhnutná reakcia je nevyhnutná. Oneskorený zásah môže viesť k strate dôležitých údajov. | V prípade výskytov chýb na radiči RAID je na čase vykonať hĺbkovú diagnostiku a medzičasom ukladať dáta na iné úložisko. |
Pevné disky SMART nie sú v poriadku | Okamžitá výmena pevných diskov. | Nevyžaduje sa žiadna štatistika. |
Problémy so softvérom | ||
Dostupnosť služieb kritickej infraštruktúry (napr. Terminálový server) | Napríklad, ak k incidentu došlo v noci, keď si to zamestnanci spoločnosti nevšimnú, má správca možnosť službu obnoviť skôr, ako si všimne poruchu. | Ak sa kritické servisné incidenty vyskytujú pravidelne, mali by ste zvážiť audit IT a reorganizáciu infraštruktúry. |
Služba sa nespustila | Analyzujte denníky a stanovte dôvod ukončenia služby. Pokúste sa bežať v manuálnom režime bez čakania na incident od používateľov. | Analyzujte správanie kľúčových služieb. Ak k zastaveniu dôjde príliš často, preinštalujte operačný systém. |
Počet bežiacich procesov> 200 pre server bez terminálov | Skontrolujte prebiehajúce procesy, ak sú mnohé rovnaké - zistite povahu a pôvod. Vírusy sa často správajú takto. | Preťaženie znamená, že jeden server kombinuje príliš veľa úloh. Pravdepodobne pomôže distribúcia funkcií na rôznych fyzických zariadeniach. |
Bezpečnostné obavy | ||
Veľký počet neautorizovaných pokusov o prihlásenie v krátkom čase | V protokoloch nájdete pokusy o prelomenie zabezpečenie hrubou silou (priame skúšanie hesla). Ak prichádzajú z lokálne siete tak treba vyhľadať útočiaceho hostiteľa. Ak prichádzajú z externej IP adresy je potrebné skontrolovať IT infraštruktúru na prítomnosť vírusov. | Na základe štatistík zistiť kedy sa útoky začali a s čím mohli súvisieť. Napríklad v momente publikovania terminálového servera priamo na internete. |
Potenciálne nebezpečné udalosti (napríklad pridanie používateľa do skupiny) | V prípade viacerých administrátorov si správca preverí, či bolo zvýšenie práv vykonané na základe požiadavky od autorizovanej osoby. | Časté zmeny v právach používateľov naznačujú, že skupinová politika nie je dobre navrhnutá. |
Prihlásenie neznámej osoby pomocou účtu správcu | Správca systému vie kedy sa prihlasujú osoby, ktoré majú administrátorské práva. V prípade, že on jediný má tieto oprávnenia tak je čas na spustenie poplachu. V prípade, že majú prístup aj iné osoby tak sa overí, či nepristupujú oni. | Uchovávanie záznamov o aktivite pomáha pri určení či sa jednalo o úmyselné poškodenie programov a dát. |
Problémy s periférnym a sieťovým hardvérom | ||
Rozhranie routera neodpovedá | Ak sa používajú dvaja poskytovatelia internetu tak je jeden dočasne nefunkčný. | Analýza dlhodobo zbieraných štatistík umožňuje vyhodnotiť kvalitu služieb poskytovateľa. |
Vyťaženie internetu >80% | Pomocou routera zistíte, ktorý užívateľ je zodpovedný za zvýšené vyťaženie. Môže sa jednať o sťahovanie alebo streamovanie multimediálneho obsahu, spustenie torrentov alebo infekciu vírusom. | Ak nazbierané dáta ukážu, že sa zvýšené vyťaženie netýka žiadneho užívateľa a nejedná sa ani o vírus tak je na mieste zvážiť zvýšenie rýchlosti internetového pripojenia. |
Chyby tlačiarne, skeneru alebo multifunkčného zariadenia | Pred použitím skontrolujte stav periférneho zariadenia. | Ak sa problémy s periférnymi zariadeniami vyskytujú príliš často je odporúčané ich odniesť do servisu. |
Požiadavky na nasadenie automatizovanej diagnostiky
Monitorovací server tvorí súčasť takmer každej IT infraštruktúry. V IT infraštruktúre pozostávajúcej z desiatok počítačov bude stačiť 2 jadrový procesor s frekvenciou 3GHz a 2GB RAM. Monitorovací agenti, ktorý zhromažďujú dáta o sledovaných ukazovateľoch sa vyrábajú aj pre prostredia s MS Windows aj Linux. Je možné monitorovať sieťové prvky (protokol SNMP) aj servery (protokol IPMI). Na počiatočnú implementáciu postačujú základné znalosti o administrácií systémov Linux. Spravovať a prehliadať zozbierané dáta je možné prostredníctvom prehľadného užívateľského webového rozhrania. Rozhranie zahŕňa: grafy, notifikácie a nastavenia kde sa dajú upravovať základné parametre. Rozhranie monitorovacích systémov je užívateľsky prívetivé a prispôsobiteľné aby vyhovovalo aj vedúcim pracovníkom aj IT manažérom. Pozorované ukazovatele sú zobrazené vizuálne prostredníctvom intuitívnych grafov, ktoré podporujú filtrovanie pomocou logických operátorov. Základné a používané senzory sú už nakonfigurované a uložené v šablónach takže implementáciu je pomerne jednoduchá. Notifikácie pri prekročení zvolených hraníc sa dajú nastaviť tak aby sa zobrazovali na monitorovacom paneli, posielali sa emailom alebo SMS. Politika notifikácií je navyše prispôsobiteľná a dá sa flexibilne nastavovať a konfigurovať podľa priorít alebo skupín používateľov. Monitorovací systém sa dá taktiež integrovať s Active Directory.
Kto potrebuje MS?
Monitorovací systém je užitočný pre veľké aj malé spoločnosti bez ohľadu na odvetvie a segment, v ktorom pôsobia. Našim klientom ponúkame a poskytujeme monitorovanie aj keď majú iba 1 server. Naši IT špecialisti 1. a 2. úrovne (L1 a L2) neustále sledujú monitorovacie systémy a preto vieme proaktívne reagovať. Anomálie zaregistrujeme a vyriešime ešte pred tým ako si naši zákazníci všimnú akýkoľvek problém alebo dôjde k incidentu. Zozbierané dáta a ich interpretáciu navyše poskytujeme aj našim zákazníkom v prípade potreby modernizácie alebo výmeny systému a technického
Stále ste sa nerozhodli a máte otázky?
Odpovieme a nájdeme pre Vás idealne riešenie.