Podejścia do tego zagadnienia mogą być różne, ale generalnie składają się z trzech podstawowych komponentów:
Te trzy elementy muszą być odpowiednio zsynchronizowane, współdziałające ze sobą dla uzyskania celu ostatecznego: zapewnienia dostępności usług i aplikacji.
Wykrywanie uszkodzeń jest punktem wyjściowym, który łączy pozostałe dwa komponenty. Jeżeli uszkodzenie nie może być wykryte, nie może też być usunięte. Jednakże samo wykrycie uszkodzenia nie zapobiega wyłączeniu z działania.
Mechanizm automatycznego odtwarzania może tu pomóc w pewnym zakresie, ale nawet bardzo wyrafinowane narzędzia nie mogą automatycznie obsługiwać wszystkich odtworzeń. W przypadku gdy odtwarzanie automatyczne nie jest możliwe, personel IT musi podjąć akcję w celu rozwiązania problemu i utrzymania dostępności systemu. Problemem jest w tych przypadkach zarządzanie natłokiem incydentów (zdarzeń) wykrytych przez narzędzia monitorujące. Aby sprostać takim wyzwaniom, proces zarządzania uszkodzeniami musi mieć dobry komponent zarządzania incydentami.
Efektywny system zarządzania incydentami powinien:
Zadaniem systemu jest ułatwienie zarządzania różnorodnymi zdarzeniami. Musi on zapewniać wystarczającą informację, pozwalającą operatorowi na szybkie działanie, gdy pojawi się jakiekolwiek uszkodzenie, a także zmniejszyć konieczność angażowania do tego celu specjalnego eksperta.
Taki system jest zależny od zdolności wykrywania incydentów przez narzędzia monitorujące i przełożenia tych zdarzeń na informacje, które administrator i personel zarządzający mogą wykorzystać do podejmowania odpowiednich decyzji.
Generalnie system zarządzania zdarzeniami powinien zapewniać:
Z architektonicznego punktu widzenia istotne są dwa nowe komponenty: serwer warstwy pośredniej do zarządzania incydentami i zorientowany na operatora GUI do wizualnego identyfikowania uszkodzeń.