Zarządzanie cyklem życia informacji

ITpedia

Znaczenie ochrony danych - oraz zarządzania tymi danymi, z chwilą gdy stają się chronione - jest czynnikiem napędowym wielu inicjatyw w zakresie pamięci masowych. Jedną z bardziej interesujących jest koncepcja cyklu życia informacji, która zakłada, że wartość danych (i informacji jakie niosą) zmienia się zgodnie z generalnie przewidywalnym zbiorem okoliczności czy warunków. Ponieważ warunki te są znane, proaktywne zarządzanie danymi na każdym etapie ich życia staje się zadaniem, które musi uwzględniać wszystkie aspekty aplikacyjne i wymagania prawne (wymagane okresy archiwizowania pewnych rodzajów danych.

Termin „zarządzanie cyklem życia informacji” (ILM - Information Life-cycle Management) jest relatywnie nowy, ale koncepcja ta pojawiła się już jakiś czas temu. Z początkiem lat 90. (ubiegłego stulecia) nawet największe urządzenia pamięci masowej były niewielkie w porównaniu z tym, co można spotkać w dzisiejszych mainframe. Dostawcy mainframe, pod presją zarządców IT napotykających ograniczenia pamięciowe w ich pierwotnych (i bardzo drogich) urządzeniach pamięciowych, zaczęli projektować metody migracji danych z drogich urządzeń dyskowych (takich jak DASD - Direct Access Storage Device) na mniej wydajne, ale za to tańsze urządzenia taśmowe i dyski optyczne. Magazyny danych przybierały formę struktury hierarchicznej: z szybkimi, drogimi urządzeniami na wierzchołku i wolnymi, tańszymi urządzeniami na dole. Tak więc proces migracji danych z DASD na taśmy znany jest jako HSM (Hierarchical Data Management).

Migracja danych na urządzenia taśmowe zazwyczaj jest inicjowana manualnie. Wykonywana jest trybem wsadowym w modelu FIFO (First In - First Out) i przenosi starsze dane na wolniejsze nośniki, zapewniając miejsce dla nowych danych bez względu na ich aktualną wartość.

W procesie tym używa się różnorodnych wskaźników sygnalizujących przekroczenie progu, po którym użytkowanie dysku jest zagrożone ze względu na przepełnienie - gdy to się wydarzy, wykonuje się składowanie dysku na taśmę. Wymaga to minimalnego zarządzania i chociaż dostawcy urządzeń taśmowych zapewniają wiele udogodnień, czas przenoszenia danych na taśmy jest relatywnie długi.

ILM skupia się natomiast na powiązaniu danych z ich wartością biznesową i zapewnia zarządzanie danymi w zgodzie z ich znaczeniem. Taka korelacja jest niezmiernie ważna. Oznacza ona, że systemy zarządzania przenoszą dane do urządzeń, które zapewniają poziom obsługi, odpowiedni dla ich znaczenia i intensywności użytkowania. Dane o największym znaczeniu i często używane wymagają wysokiej dostępności, co implikuje konieczność stosowania wysoko wydajnych urządzeń i zapewnienia wysoko wydajnych usług składowania i odzyskiwania. Dane o mniejszej wartości (lub dane o dużym znaczeniu, które nie wymagają szybkiego dostępu) są przydzielane mniej wydajnym, tańszym urządzeniom.

Zasadnicza różnica pomiędzy ILM i HSM polega na tym, że w systemie ILM dane są śledzone i utrzymywane na poziomie dostępności zdefiniowanym przez zarządcę IT. Tak więc jeżeli poszczególne zestawy danych mają wymaganie dostępności w czasie 30 minut w dowolnych warunkach, polityka ILM będzie zapobiegać ich transmisjom na urządzenia, które nie mogą zapewnić takiego poziomu usługi.

Kolejną zaletą przenoszenia danych na definiowany przez reguły polityki osprzęt pamięciowy jest lepsza optymalizacja całego systemu pamięci zewnętrznej. Dzięki możliwości ustanowienia reguł polityki zapewniających, iż dane o niższej wartości nie zajmują drogiej przestrzeni w wysoko wydajnych urządzeniach, uzyskuje się dodatkową korzyść - optymalizowanie użytkowania dysku z uwzględnieniem wartości zapisywanych na nim danych. Można zapewnić wysoko wydajną pamięć dla danych, które na to zasługują, rezygnując jednocześnie z inwestycji w dodatkowe wysoko wydajne pamięci zewnętrzne z powodu lepszej efektywności przydzielania zasobów będących już w posiadaniu.

Wrodzoną cechą ILM jest też śledzenie danych przez cały cykl ich życia, i zapewnienie ciągłego audytu dostępnego dla wszystkich, którzy tego potrzebują.

Zarządzanie cyklem życia danych zaczyna się w momencie, gdy dane znajdą się w systemie, a kończy się w momencie, kiedy zostaną na trwałe z niego usunięte.


Zobacz także

-
-