A Hard Disk Sentinel megoldása – I.
A S.M.A.R.T. mögötti ötlet szép, a valóság sokkal kiábrándítóbb. Szerencsére nincs minden veszve, pusztán nekünk kell a S.M.A.R.T. adataiból épkézláb következtetéseket levonni. Ezt megtehetjük kellő szakértelemmel a nyers adatokat elemezgetve, de sokkal egyszerűbb egy megfelelő szoftvert igénybe venni, ami segít eligazodni a S.M.A.R.T. adatok kavalkádjában.
A S.M.A.R.T. specifikációja szerint egy probléma észlelésétől és jelentésétől még 24 órát kell a merevlemeznek működnie, amíg az adatok mentése folyik – szakértők szerint azonban a legtöbb esetben ez nagyon kevés, alaposabb megelőzésre van szükség. Egy ilyen program a magyar fejlesztésű, beszédes nevű Hard Disk Sentinel, azaz Merevlemez Őrszem.
A Hard Disk Sentinel koncepciója és működése
Az valóban elég ritka, hogy minden különösebb ok nélkül egy merevlemez elhalálozzon, kivéve a leesést, túlfeszültséget, természeti katasztrófát, melyeket értelemszerűen nem jelez előre a S.M.A.R.T. (sem). Általában néhány hibás szektor megjelenik, ezek száma egyre nő, a lemez állapota lassan, de folyamatosan romlik – akár hetek is elmúlhatnak „tünetmentesen”. Más esetben a magas hőmérséklet és/vagy kevés számú, de nagyon kritikus hiba (például felpörgés sikertelensége) adhat okot aggodalomra.
Nem ritka az sem, hogy több különböző probléma jelentkezik, melyek együttes hatása más és más hibára enged következtetni. Például ha a merevlemez nehezen (csak többszöri újrapróbálkozás után) vagy lassan pörög fel (mely motor-, illetve csapágyhibára enged következtetni), annak nyoma van a S.M.A.R.T. adatmezőkben. De akár csak egyetlen újabb hibás vagy gyenge szektor is bejegyzésre kerül, tehát minden változás (még ha csekély mértékű is) észlelhető.
Fontos, hogy ezeket a jeleket időben felismerjük és jóval az adatvesztés előtt fel tudjunk lépni. Ezért lényeges, hogy a korábban használt modellt teljesen mellőzve, a gyártóspecifikus küszöbértékeket (vagy azok hiányát, rossz megválasztását) figyelmen kívül hagyva a nyers mért értékeket vegyük alapul, azok alapján alkossunk véleményt a merevlemezről, lehetőség szerint az egyes attribútumok közötti kölcsönhatást, összefüggést is vizsgálva. Így valós képet kaphatunk a lemez állapotáról, megtudhatjuk, mi okoz problémát, és esetleg mit tehetünk a védekezés, megelőzés érdekében.
Érdemes az értékelést a merevlemez használatának, és az adatok fontosságának figyelembevételével megválasztani. Egy komolyabb használat alatt álló, nagyobb igénybevételű (például szerverben vagy hordozható számítógépben lévő), illetve kritikus adatokat tartalmazó merevlemez esetén a legkisebb hiba is végzetes lehet, így fontos, hogy bármilyen apró botlás, hiba esetén azonnal lépni lehessen.
A szoftverek egy része képes ilyen módon (módokon) értékelni a merevlemez állapotát, valamint szöveges értékelést készíteni, esetleges tippeket adni a problémák orvoslására. Hasznos funkció, ha az esetleges új problémák észlelésekor a szoftver nem csak passzívan tud figyelmeztetni (például hangjelzéssel, üzenet küldésével, lekapcsolással), hanem aktívan is képes fellépni, például teljes vagy részleges adatmentési (archiválási) feladatok indításával.
A Hard Disk Sentinel kialakítása a fentiek figyelembevételével történt. A fejlesztés során a Králik és Társa Kft.-hez adatmentésre érkezett merevlemezek S.M.A.R.T. adatait elemezve készült el a lemezek értékelését végző modul, mely a szöveges értékeléssel együtt pontos képet ad a valóban előforduló problémákról. A fejlesztés során lehetőség volt megvizsgálni számos különböző gyártójú és típusú merevlemez állapotát – melyek már csak komoly adatmentő módszerek segítségével voltak működőképesek. Fontos megemlíteni, hogy ezen merevlemezek túlnyomó többségénél a „hagyományos” S.M.A.R.T. valóban nem jelzett meghibásodás előtt.
Egy szemléletes példa
Az alábbi S.M.A.R.T. attribútumokkal rendelkező merevlemez működésképtelen állapotban került adatmentésre:
Azonosító | Attribútum neve | Küszöb | Érték | Legrosszabb | Adat | Állapotjelzők | Kritikus? |
1 | Raw Read Error Rate | 50 | 100 | 100 | 000000000000 | 000B | igen |
2 | Throughput Performance | 50 | 100 | 100 | 000000000000 | 0005 | |
3 | Spin Up Time | 1 | 100 | 100 | 0000000001E9 | 0027 | |
4 | Start/Stop Count | 0 | 100 | 100 | 000000000A5A | 0032 | |
5 | Reallocated Sectors Count | 50 | 100 | 100 | 000000000015 | 0033 | igen |
7 | Seek Error Rate | 50 | 100 | 100 | 000000000000 | 000B | igen |
8 | Seek Time Performance | 50 | 100 | 100 | 000000000000 | 0005 | |
9 | Power-On Time Count | 0 | 87 | 87 | 0000000014C1 | 0032 | |
10 | Spin Retry Count | 30 | 152 | 100 | 000000000000 | 0033 | igen |
12 | Drive Power Cycle Count | 0 | 100 | 100 | 0000000009EA | 0032 | |
192 | Vendor-specific | 0 | 100 | 100 | 000000000058 | 0032 | |
193 | Load/Unload Cycle Count | 0 | 73 | 73 | 00000004218D | 0032 | |
194 | HDD Temperature | 0 | 100 | 100 | 003B00020024 | 0022 | |
196 | Reallocation Event Count | 0 | 100 | 100 | 00000000000F | 0032 | |
197 | Current Pending Sector Count | 0 | 100 | 100 | 000000000004 | 0032 | |
198 | Off-Line Uncorrectable Sector Count | 0 | 100 | 100 | 000000000000 | 0030 | |
199 | Ultra ATA CRC Error Count | 0 | 200 | 200 | 000000000000 | 0032 | |
220 | Disk Shift | 0 | 100 | 100 | 0000000000B3 | 0002 | |
222 | Loaded Hours | 0 | 95 | 95 | 0000000007EA | 0032 | |
223 | Load/Unload Retry Count | 0 | 100 | 100 | 000000000000 | 0032 | |
224 | Load Friction | 0 | 100 | 100 | 000000000000 | 0022 | |
226 | Load-in Time | 0 | 100 | 100 | 00000000017F | 0026 | |
240 | Head flying hours | 1 | 100 | 100 | 000000000000 | 0001 | igen |
A BIOS által támogatott S.M.A.R.T. ellenőrzés problémát nem jelzett. A táblázatot áttanulmányozva látható, hogy az Érték oszlopban található számok (100, illetve a felettiek) a Küszöb értékektől nagyon távol állnak, sőt többségük (a 100-as értékek) el sem mozdult a maximális kondíciót jelző szintről. Emiatt a gyártóspecifikus értékek elemzésével a merevlemez nemhogy hibásnak nem mutatja magát, de a kondíciója tökéletesnek tűnik. A 100-nál alacsonyabb értékek a merevlemez működési idejéből adódnak, mindazonáltal a lemez összesen csak 5313 órát (0x14C1) töltött bekapcsolva (jelen merevlemeznél a teljes működési időt a gyártó vélhetőleg jól adta meg, azt kiszámítva nagyjából 4,7 évet kapunk napi 24 órás üzemmódban használva: (5313/0,13)/24/365 = 4,665 év). Tehát elhasználódásról még szó sem lehet.
Ezzel szemben a Hard Disk Sentinel értékelő algoritmusa segítségével egészen más eredményt kapunk. Mivel a kérdéses merevlemez egy hordozható számítógépben használt 2,5 hüvelykes példány, a szigorúbb értékelési módszer segítségével kerül értékelésre a merevlemez állapota. Az értékelésben részt vesznek azon attribútumok is, melyek funkciójuk szerint felelősek a lemez valós állapotáért – még ha azok a gyártó szerint nem is kritikusak.
A kondíció számítása (figyelembe véve az 5-ös, 196-os, 197-es attribútumok Adat mezőjében található értékeket):
100 x (100 – 10 x 6) x (100 – 30) x (100 – 4 x 4) = 23,52%
Az értékelés alapján a merevlemez kondíciója igencsak aggasztó. A szoftver alaphelyzetben ilyen kondíció esetén már figyelmeztet, hogy adatvesztés várható. A megfelelő számítási módszer kiválasztásával és a megfelelő riasztási szint beállításával még akár ennél korábban is jelezhető lett volna az adatvesztés ennél a merevlemeznél – ha a megfelelő szoftvert előzőleg telepítik.
A cikk még nem ért véget, kérlek, lapozz!