Miesięcznik informatyków i menedżerów IT sektora publicznego

Piotr Kubiszewski

Kopia na czasie

DOBRE PRAKTYKI | Aż 27% administratorów ankietowanych w badaniach Forrester Research przyznało, że w ciągu ostatnich pięciu lat przynajmniej raz odtwarzało dane po awarii systemu. By taka operacja zakończyła się sukcesem, konieczne jest właściwe podejście do kwestii tworzenia kopii zapasowych.

Fot. D. Stańda

Podobno użytkowników komputerów można podzielić na tych, którzy regularnie wykonują kopie zapasowe swoich danych, a także na tych, którzy... dopiero będą je robili. Żarty na bok, sprawa jest naprawdę poważna - brak regularnie wykonywanych back-upów może spowodować prawdziwą katastrofę - nie tylko u osób prywatnych, ale przede wszystkim w funkcjonowaniu firm i instytucji. Najgorsze jest to, że najbardziej mści się uśpiona czujność - długie miesiące bezawaryjnej pracy z reguły rozluźniają najsztywniejsze nawet procedury, czego owoce niejednokrotnie okazują się opłakane w skutkach. Nie dajmy się więc zwieść ciszy, gdyż prędzej czy później okaże się ona ciszą przed burzą.

Przyjrzyjmy się zatem, jak tworzyć procedury backupu, które nie będą ani zbyt ostre w stosunku do potrzeb naszej instytucji, ani też zbyt luźne. Pamiętajmy też, że wykonywanie kopii zapasowych to tylko jeden z elementów polityki bezpieczeństwa informacji, która powinna powstać w każdym urzędzie.

Co i kiedy archiwizować

Zacznijmy od przeanalizowania danych gromadzonych przez naszą instytucję i podzielenia ich na kilka kategorii. Z reguły wystarczy określić, które dane są krytyczne (bez nich urząd nie może funkcjonować), ważne (są potrzebne do funkcjonowania instytucji, ale bez nich pracownicy mogą działać przez pewien czas) oraz nieistotne (ich utrata nie wpłynie w żaden sposób na działanie urzędu). Zwłaszcza dla pierwszej kategorii danych należy określić maksymalny czas ich odtwarzania po awarii. Jest to istotne, gdyż od tego parametru będzie zależeć, jaką metodę tworzenia kopii zapasowych wybierzemy.

Dane wytwarzane w organizacji można też podzielić według drugiego kryterium - łatwości odtworzenia z innych źródeł. Oczywiście, najczęściej backupowane powinny być informacje trudne do odtworzenia, te zaś, które można odtworzyć np. z dokumentów papierowych czy innych źródeł, mogą być archiwizowane znacznie rzadziej. Przykładowo - należy zastanowić się, czy kopie zapasowe wykonywać tylko dla danych z serwerów, czy również dla danych ze stacji roboczych. Istotne jest też określenie, czy archiwizować same dane, czy np. także aplikacje. Może się bowiem okazać, że samo zainstalowanie oprogramowania z płyt instalacyjnych bez odtworzenia ich ostatniej konfiguracji nie wystarczy do powrotu do sytuacji sprzed awarii.

Wynikiem naszej analizy powinna być specyfikacja określająca, co i jak często należy poddawać procedurze backupu. W najbardziej krytycznym przypadku może się okazać, że najważniejsze dane powinny być archiwizowane natychmiast po ich powstaniu. W takiej sytuacji dane należy dublować przy użyciu technik mirroringu. Niektóre skomplikowane aplikacje (takie jak np. bazy danych SQL) potrafią to robić samodzielnie. Zastosowanie mirroringu nie zwalnia nas jednak z obowiązku wykonywania kopii zapasowych.

Wracając do kwestii częstotliwości backupowania krytycznych danych, może się okazać, że w niektórych przypadkach konieczne jest archiwizowanie części danych np. co godzina, a w innych - tylko raz w tygodniu czy miesiącu. Oczywiście nie ma sensu tworzenie skomplikowanego schematu z danymi podzielonymi na dziesiątki kategorii i podkategorii, z których każda archiwizowana będzie w inny sposób i w innych odstępach czasu. Najlepiej zbiory danych podzielić na maksymalnie kilka kategorii i dla nich określić częstotliwość i sposób backupowania. Trzeba też określić, o jakiej konkretnie godzinie należy wykonywać poszczególne kopie zapasowe. Jeśli bowiem w środku dnia pracy nagle uruchomiony zostanie proces wykonywania kopii zapasowej najważniejszej dla funkcjonowania instytucji bazy danych, może się okazać, że praca urzędu po prostu zatrzyma się w miejscu. Przykładowa procedura dla serwerów może zakładać wykonywanie kopii pełnych wszystkich danych w piątki po zamknięciu urzędu, a kopii różnicowych codziennie o godz. 17, a w przypadku stacji roboczych - kopii pełnych raz w miesiącu w pierwszy piątek miesiąca po zamknięciu instytucji, natomiast przyrostowych - w kolejne piątki. Oczywiście, to stosunkowo prosty schemat - w przypadku wielu urzędów może okazać się niewystarczający lub nieadekwatny.

Jak archiwizować

W kolejnym kroku należy się zastanowić, w jaki sposób dane archiwizować - czy trzeba zawsze wykonywać kopie pełne, czy też stosować kombinację kopii pełnych, różnicowych lub przyrostowych (patrz: ramka "Rodzaje kopii zapasowych"). Jeśli w trakcie analizy okaże się, że czas odtwarzania części danych musi być ograniczony do absolutnego minimum, wówczas na pewno trzeba zdecydować o przygotowywaniu zawsze kopii pełnych tych danych. Jeśli czas odtwarzania może być nieco dłuższy, wówczas - w celu skrócenia czasu tworzenia backupów - możliwe jest wykonywanie np. raz w tygodniu kopii pełnych, a następnie codziennie kopii różnicowych. Gdy natomiast okaże się, że dane mogą być bez większej szkody odtwarzane nawet kilka godzin, wystarczy zapewne wykonywanie raz na jakiś czas kopii pełnych, a codziennie - kopii przyrostowych.

Istotne jest także określenie, czy wykonanie backupu ma być inicjowane automatycznie przez oprogramowanie, czy samodzielnie przez operatora. Jeśli w naszym przypadku wymagana jest pewna elastyczność momentu rozpoczynania tworzenia kopii, konieczne jest oczywiście inicjowanie procesu przez człowieka. Bez wątpienia wygodniejszym i pewniejszym rozwiązaniem jest jednak pełna automatyka, o ile oczywiście jest ona możliwa.

Procedury ochrony i przywracania

Istotną kwestią jest miejsce przechowywania kopii bezpieczeństwa. Rygorystyczne przepisy stosowane w firmach i instytucjach, w których ochrona danych jest jednym z podstawowych problemów, zakładają przechowywanie kopii zapasowych w oddzielnych budynkach, najlepiej oddalonych od "głównej siedziby" danych. Chodzi o to, by w razie pożaru, powodzi czy innego tego typu zdarzenia nie utracić zarówno źródła danych, jak i ich backupów.

Wybór nośnika, na którym mają być wykonywane i przechowywane kopie bezpieczeństwa, zależy np. od naszych wymagań odnośnie do szybkości dostępu do zarchiwizowanych danych w razie awarii. Jeśli czas jest parametrem krytycznym, należy wybrać pamięci dyskowe. Jeśli czas jest mniej istotnym parametrem, z powodzeniem można zastosować pamięci taśmowe (patrz: artykuł na s. 22) lub nośniki optyczne (płyty CD/DVD). Trzeba ponadto pamiętać, że różne nośniki mają różne parametry i w związku z tym dane na nich przechowywane mają różną żywotność (więcej na ten temat pisaliśmy w artykule "Dane, które mogą zniknąć", IT w Administracji 2008, nr 9). Ma to znaczenie przede wszystkim w przypadku danych, które mają być przechowywane przez wiele lat.

Kolejnym zagadnieniem, które należy wziąć pod uwagę przy tworzeniu procedur bezpieczeństwa, jest dostęp różnych osób do zarchiwizowanych danych. Informacje poufne należy oczywiście przechowywać w miejscach dostępnych jedynie dla osób powołanych. Jak już wspomnieliśmy, dodatkowo miejsce składowania tych danych trzeba dobrać tak, by uniknąć ewentualnych konsekwencji zdarzeń losowych, takich jak pożary czy np. zalania. Należy więc także zadbać o system bezpieczeństwa przechowywanych kopii zapasowych. Z tego powodu backupy trzymane są często w innych lokalizacjach, w budynkach strzeżonych i obwarowanych skomplikowanym systemem przepustek.

Inną ważną kwestią jest liczba przechowywanych kopii bezpieczeństwa. Wydaje się, że najlepiej przechowywać co najmniej dwie ostatnie pełne kopie wraz z kopiami przyrostowymi lub różnicowymi. W specyficznych przypadkach może oczywiście okazać się, że należy zwiększyć tę liczbę lub - przy mniej newralgicznych danych - zmniejszyć. W praktyce zależy to po prostu od specyfiki danych, które mają być archiwizowane, np. długości trwania projektu, wymogów kierownictwa itp.

Schron dla danych

Na zakończenie przypomnijmy jeszcze raz: pamiętajmy, że dane archiwizuje się na wypadek katastrof, które zdarzają się niezwykle rzadko i z reguły w sposób niesygnalizowany. Najgorsze, co może zdarzyć się osobom odpowiedzialnym za wykonywanie kopii bezpieczeństwa danych, to uśpienie czujności. Dobrze zaprojektowany i sprawnie funkcjonujący system bezpieczeństwa to z jednej strony gwarant spokojnego snu, z drugiej jednak - niebezpieczny "usypiacz". Pamiętajmy o tym i przypominajmy też od czasu do czasu naszym szefom.

Autor jest absolwentem Politechniki Wrocławskiej, byłym redaktorem naczelnym miesięcznika "CHIP" i wieloletnim redaktorem tego pisma. Opublikował wiele artykułów z zakresu szeroko rozumianej tematyki komputerowej. Obecnie koncentruje się na działalności w zakresie sprzedaży treści w Internecie.

 
 

Admin wITek

Admin wITek - Lipiec 2010

Galeria wITka   

Polecamy

Biblioteka Informacja Publiczna

Specjalistyczne publikacje książkowe dla pracowników administracji publicznej

więcej