| Samonaprawiające się dyski |
|
|
|
|
Samonaprawiające się dyski Każda usterka sprzętu, którego używamy wywołuje u nas marzenia o urządzeniach, które powiadamiałyby nas, że wystąpiła awaria, a jeszcze lepiej – same się naprawiały. Nawet nie wiemy, że to już nie marzenia, ale rzeczywistość, przynajmniej jeżeli chodzi o dyski twarde. Najnowsze osiągnięcia w dziedzinie technologii dysków twardych sprawiają, że napędy dyskowe uzyskują zdolność nie tylko do monitorowania własnej sprawności, lecz także „samonaprawiania się” w przypadku typowych usterek. W dysku twardym dane cyfrowe są zapisywane na talerzu magnetycznym, a potem odczytywane, zasadniczo w postaci analogowej. Podobnie jak przy każdym nośniku analogowym, danym zapisanym na dysku towarzyszą szumy tła, a sam nośnik jest podatny na uszkodzenia fizyczne. Rozpoznanie faktu, że dane zostały uszkodzone oraz podjęcie jakichkolwiek działań naprawczych jest możliwe dzięki temu, że z zasady do zapisywanej informacji dodaje się pewną informację dodatkową, która jest uzależniona od zawartości informacji oryginalnej. W dyskach twardych stosuje się zaawansowane metody obliczania i kodowania sum kontrolnych, określane jako ECC (Error Correcting Codes – kody korygujące błędy). Chociaż teoria z tym związana jest ogromnie skomplikowana, w praktyce wyznaczenie kodu korekcyjnego dla danych można w miarę prosto zrealizować za pomocą sprzętu lub oprogramowania. Dzięki dobremu algorytmowi ECC możliwe jest nie tylko wykrywanie błędów, lecz także odtworzenie uszkodzonej informacji. Obliczanie kodu korekcyjnego wchodzi w skład procesu odzyskiwania danych, w którym ponadto stosuje się takie techniki, jak wielokrotny odczyt przy kolejnych obrotach talerza z drobnymi zmianami parametrów odczytu, co daje różne „kąty widzenia” uszkodzonych danych. Wszystkie te „sztuczki” pozwalają na odczytanie danych z sektora, który nie nadaje się do dalszego użytku. Co dalej? Dyski twarde zawierają pewną liczbę „zapasowych sektorów”, które nie są bezpośrednio dostępne dla użytkownika, lecz służą do zastępowania wadliwych sektorów wykrytych na dysku. Gdy jeden z zapasowych sektorów zostanie zaalokowany w zastępstwie sektora uszkodzonego, z punktu widzenia użytkownika dysku wygląda to tak, jakby uszkodzenie zostało naprawione. Jeżeli wszystkie uszkodzone sektory są odwzorowywane na dobrych sektorach zapasowych, to dysk z punktu widzenia użytkownika jest całkowicie sprawny. Alokacja zapasowych sektorów może odbywać się z wyprzedzeniem, w miarę zużywania się dysku. Metoda ta polega na tym, że podczas odczytu bloku danych układ elektroniczny, odpowiedzialny za ECC, dokonuje inteligentnej analizy jakości sektora. W niektórych przypadkach dane zostają zapisane nieprawidłowo – na przykład wskutek mechanicznego wstrząsu napędu podczas zapisu – i wówczas całkowita naprawa sprowadza się jedynie do ponownego zapisu tych samych danych. Jeżeli jednak analiza podejrzanego sektora wykazuje, że nie zapewnia on należytej niezawodności, wówczas układ sterowania napędu może podjąć decyzję wykorzystania sektora zapasowego i zapisania w nim odzyskanych danych. Chociaż obecnie nie ma sposobu, by technologia SMART pozwoliła przewidzieć nagłą awarię dotychczas zupełnie sprawnego dysku, to jednak zapewnia ona skuteczne ostrzeganie o zbliżającej się awarii w około 30 do 40 procentach przypadków. Aby można było skorzystać z technologii SMART, w systemie musi zostać zainstalowany odpowiedni agent (program obsługi). Odzyskiwanie danych w nowoczesnych napędach dyskowych jest bardzo sprawne – napęd zasygnalizuje błąd odczytu dopiero po wyczerpaniu daleko idących środków zaradczych. Możliwość alokacji zapasowych, dobrych sektorów na miejsce uszkodzonych oznacza, że usterki – które w innym wypadku byłyby klasyfikowane jako awarie dysku - mogą być aktywnie kontrolowane, dzięki czemu wydłuża się użyteczny czas eksploatacji urządzenia. SMART zapewnia prognozowanie możliwych awarii dysku, dzięki czemu dane z dysku o pogarszającej się jakości mogą być zapisane w kopii zapasowej, a dysk wymieniony, zanim dojdzie do katastrofalnej utraty danych. Wszystkie te mechanizmy opierają się jednak na zdolności napędu do właściwego reagowania na usterki przez korekcję błędów, realokację sektorów oraz analizę i rejestrowanie wyników. Działania takie mogą dotyczyć tylko tych części dysku, które są użytkowane, a wskutek tego stan znacznej części powierzchni dysku może przez długi czas być nieznany, a wtedy błędy skądinąd możliwe do naprawienia stopniowo stają się coraz poważniejsze, zaś analizy statystyczne prowadzone przez SMART zostają zafałszowane.
|