Niezawodność hostingu to cecha powszechnie pożądana. Składa się na nią bardzo wiele elementów. Hosting nie mógłby funkcjonować m.in. bez pamięci RAM. Przeczytaj, żeby dowiedzieć się, co wspólnego ma niezawodność Twojego hostingu z promieniowaniem kosmicznym?

1. Jak działa pamięć RAM

Klasyczny moduł pamięci RAM, obojętnie czy starszej DDR3, czy nowszej DD4 zawiera w sobie komórki pamięci, a więc mikroskopijne struktury magazynujące w sobie bity informacji. Jak powszechnie wiadomo, pojedynczy bit reprezentuje jedną z wartości – albo „zero”, albo „jeden”. Mówimy, że komputery działają w systemie binarnym.

Zapisanie w wyżej wspomnianej komórce przykładowej wartości „jeden” oraz jej odczytanie w niezmienionej postaci stanowi proces naturalny, pożądany, poprawny. Błąd natomiast następuje w momencie, gdy po zapisaniu wcześniej wymienionej „jedynki” odczytuje się wartość „zerowa”… lub odwrotnie: bit powinien przechowywać wartość zerową, a podczas odczytu pojawia się jedynka. Z czego to wynika i jakie może mieć konsekwencje?.

2. Promieniowanie kosmiczne

Sięgnijmy do kronik historycznych – w roku 1912 naukowiec pochodzenia austriackiego, Victor Hess, w trakcie słynnej podróży balonem wznosi się na wysokość 5300 metrów, gdzie stwierdza wyższy poziom promieniowania niż promieniowanie obecne na powierzchni Ziemi. Skoro im dalej od Ziemi się wznosił, a promieniowanie było coraz bardziej intensywne – to oczywistym wnioskiem było pozaziemskie promieniowanie źródła.

Kilkanaście lat później Hess za swoje prace zostaje uhonorowany nagrodą Nobla. Mimo, iż do jego odkryć doszło ponad stulecie temu, dziś zagadnienia przez niego zgłębiane okazują się mieć ścisły związek z funkcjonowaniem Internetu.

W jaki sposób? Otóż okazuje się, że promieniowanie kosmiczne – promieniowanie wtórne – jest aktualnie uznawane za jedno z głównych źródeł błędów i przekłamań w modułach pamięci! To ono ma zdolność do „przestawiania” stanu bitów w tych komórkach.

Promieniowanie, na szczęście, jest w znacznym stopniu wychwytywane przez atmosferę. Im bliżej powierzchni morza się znajdujemy, tym jest słabsze. Gdyby zestawić ze sobą sprzęt komputerowy z taką samą pamięcią, znajdujący się na powierzchni Ziemi oraz podobny, ale na orbicie okołoziemskiej, okaże się, że jest silne zróżnicowanie w zakresie przekłamań w komórkach pamięci. Sonda kosmiczna Cassini, poza atmosferą ziemską, rejestrowała około 280 błędów pamięci na dobę!

Ponieważ promieniowanie słabnie wraz z pokonywaniem kolejnych warstw atmosfery – im niżej znajduje się serwer, tym rzadziej występują przekłamania pamięci wynikające z działania promieniowania kosmicznego. Teoretycznie więc wydaje się, że najlepiej byłoby mieć serwery na poziomie morza.

3. Ochrona pamięci

Istnieje sprawdzona metod na ograniczanie ryzyka ewentualnych błędów pamięci. Za jeden z najszerzej stosowanych mechanizmów uznaje się ECC, czyli w pełnej wersji anglojęzycznej – Error Correction Code, a więc mechanizm korekcji i detekcji błędów.

Jak wyjaśniamy to na naszym kanale video na YouTube: „Mamy rząd zer i jedynek, które kodują pewną informację, a obok niego znajduje się kilka bitów poświęcanych na sumę kontrolną. Jej wartość jest ściśle uzależniona od ciągów zer i jedynek we właściwej informacji. Jeśli przypadkowo jedynka zamieni się z zerem, bądź odwrotnie – suma kontrolna nie będzie się zgadzać. Pamięć z kolei odczytuje również tę sumę kontrolną, weryfikując, czy odpowiada ona danej informacji.” Tym samym bardzo łatwo i co najważniejsze – w pełni precyzyjnie – można ustalić, czy doszło do przekłamania.

Stosowanie profesjonalnych pamięci ECC zapewnia zatem wyższy poziom niezawodności usług i niższą podatność na przekłamanie informacji. Warto jednak wiedzieć, że serwer z takimi pamięciami nie będzie ani szybszy, ani tańszy, bo koszt takiej pamięci (oraz pozostałych komponentów, niezbędnych do jej obsłużenia – tj. tzw. kontrolera pamięci) jest po prostu wyższy.

4. Błędy wychwycone. Co dalej?

Poza tym, że Error Correction Code umożliwia skontrolowanie, czy doszło do przestawienia stanu bitów, pozwala także jednoznacznie ustalić, gdzie owe przestawienia nastąpiło. Ściślej – którego bitu dokładnie tyczą się błędy, co pozwala je skorygować, zapewniając właściwe ustawienia. Mechanizm umożliwia korekcję danych „w locie”, choć w odniesieniu do ograniczonej liczby „uszkodzonych” bitów.

Najlepszej klasy serwery, także te wykorzystywane w naszym hostingu, potrafią „wyłapać”, jak często moduły pamięci korzystały z opisanego powyżej algorytmu ECC. W największym uproszczeniu, im częściej zaistnieje potrzeba zastosowania algorytmu Error Correction Code, tym prawdopodobnie gorsza jest jakość/kondycja modułu pamięci.

Jeżeli z całego zestawu np. 8 modułów pamięci, jeden wyraźnie częściej „korzysta” z mechanizmu ECC – jest to sygnał świadczący o jego potencjalnej wadzi produkcyjnej i mimo, że pamięć jeszcze działa – może stanowić cenną wskazówkę do wymiany komponentu. Na panelu diagnostycznym serwera widoczna jest kontrolka ostrzegawcza, pozwalająca zareagować zanim dojdzie do zawieszenia serwera.

5. I to wszystko?

Warto pamiętać, że podsystem pamięci to tylko jeden z wielu elementów, które kształtują ogólny poziom niezawodności. Dobry hosting w 2018 roku musi spełnić o wiele więcej kryteriów, niż tylko korzystać z profesjonalnych modułów pamięci.

Zapraszamy do pozostałych wpisów na naszym blogu oraz do kanału video na YouTube, gdzie znajdziesz więcej informacji i porad na tematy związane z hostingiem, domenami i e-biznesem.

Artur Pajkert z kubkiem cyber_Folks
>
Artur Pajkert
Od 18 lat dzieli się wiedzą i poradami w sprawach e-marketingu i hostingu, jako menedżer, autor publikacji, prelegent, bloger, wykładowca akademicki.

Jedna odpowiedź do "Hosting niezawodny a promieniowanie kosmiczne"

  1. Anna Zalinka pisze:

    Super artykuł
    Bardzo trafnie i szczegółowo napisane
    Trafia do ludzi.

Dodaj komentarz

Twój adres e-mail nie będzie opublikowany.

Polecane dla Ciebie

Szukasz dalej?