Hard Disk Sentinel: S.M.A.R.T., okosan

A Hard Disk Sentinel megoldása – I.

A S.M.A.R.T. mögötti ötlet szép, a valóság sokkal kiábrándítóbb. Szerencsére nincs minden veszve, pusztán nekünk kell a S.M.A.R.T. adataiból épkézláb következtetéseket levonni. Ezt megtehetjük kellő szakértelemmel a nyers adatokat elemezgetve, de sokkal egyszerűbb egy megfelelő szoftvert igénybe venni, ami segít eligazodni a S.M.A.R.T. adatok kavalkádjában.

A S.M.A.R.T. specifikációja szerint egy probléma észlelésétől és jelentésétől még 24 órát kell a merevlemeznek működnie, amíg az adatok mentése folyik – szakértők szerint azonban a legtöbb esetben ez nagyon kevés, alaposabb megelőzésre van szükség. Egy ilyen program a magyar fejlesztésű, beszédes nevű Hard Disk Sentinel, azaz Merevlemez Őrszem.

A Hard Disk Sentinel koncepciója és működése

Az valóban elég ritka, hogy minden különösebb ok nélkül egy merevlemez elhalálozzon, kivéve a leesést, túlfeszültséget, természeti katasztrófát, melyeket értelemszerűen nem jelez előre a S.M.A.R.T. (sem). Általában néhány hibás szektor megjelenik, ezek száma egyre nő, a lemez állapota lassan, de folyamatosan romlik – akár hetek is elmúlhatnak „tünetmentesen”. Más esetben a magas hőmérséklet és/vagy kevés számú, de nagyon kritikus hiba (például felpörgés sikertelensége) adhat okot aggodalomra.

Hirdetés

Nem ritka az sem, hogy több különböző probléma jelentkezik, melyek együttes hatása más és más hibára enged következtetni. Például ha a merevlemez nehezen (csak többszöri újrapróbálkozás után) vagy lassan pörög fel (mely motor-, illetve csapágyhibára enged következtetni), annak nyoma van a S.M.A.R.T. adatmezőkben. De akár csak egyetlen újabb hibás vagy gyenge szektor is bejegyzésre kerül, tehát minden változás (még ha csekély mértékű is) észlelhető.

Fontos, hogy ezeket a jeleket időben felismerjük és jóval az adatvesztés előtt fel tudjunk lépni. Ezért lényeges, hogy a korábban használt modellt teljesen mellőzve, a gyártóspecifikus küszöbértékeket (vagy azok hiányát, rossz megválasztását) figyelmen kívül hagyva a nyers mért értékeket vegyük alapul, azok alapján alkossunk véleményt a merevlemezről, lehetőség szerint az egyes attribútumok közötti kölcsönhatást, összefüggést is vizsgálva. Így valós képet kaphatunk a lemez állapotáról, megtudhatjuk, mi okoz problémát, és esetleg mit tehetünk a védekezés, megelőzés érdekében.

Érdemes az értékelést a merevlemez használatának, és az adatok fontosságának figyelembevételével megválasztani. Egy komolyabb használat alatt álló, nagyobb igénybevételű (például szerverben vagy hordozható számítógépben lévő), illetve kritikus adatokat tartalmazó merevlemez esetén a legkisebb hiba is végzetes lehet, így fontos, hogy bármilyen apró botlás, hiba esetén azonnal lépni lehessen.

A szoftverek egy része képes ilyen módon (módokon) értékelni a merevlemez állapotát, valamint szöveges értékelést készíteni, esetleges tippeket adni a problémák orvoslására. Hasznos funkció, ha az esetleges új problémák észlelésekor a szoftver nem csak passzívan tud figyelmeztetni (például hangjelzéssel, üzenet küldésével, lekapcsolással), hanem aktívan is képes fellépni, például teljes vagy részleges adatmentési (archiválási) feladatok indításával.

A Hard Disk Sentinel kialakítása a fentiek figyelembevételével történt. A fejlesztés során a Králik és Társa Kft.-hez adatmentésre érkezett merevlemezek S.M.A.R.T. adatait elemezve készült el a lemezek értékelését végző modul, mely a szöveges értékeléssel együtt pontos képet ad a valóban előforduló problémákról. A fejlesztés során lehetőség volt megvizsgálni számos különböző gyártójú és típusú merevlemez állapotát – melyek már csak komoly adatmentő módszerek segítségével voltak működőképesek. Fontos megemlíteni, hogy ezen merevlemezek túlnyomó többségénél a „hagyományos” S.M.A.R.T. valóban nem jelzett meghibásodás előtt.

Egy szemléletes példa

Az alábbi S.M.A.R.T. attribútumokkal rendelkező merevlemez működésképtelen állapotban került adatmentésre:

 

Azonosító Attribútum neve Küszöb Érték Legrosszabb Adat Állapotjelzők Kritikus?
1 Raw Read Error Rate 50 100 100 000000000000 000B igen
2 Throughput Performance 50 100 100 000000000000 0005
3 Spin Up Time 1 100 100 0000000001E9 0027
4 Start/Stop Count 0 100 100 000000000A5A 0032
5 Reallocated Sectors Count 50 100 100 000000000015 0033 igen
7 Seek Error Rate 50 100 100 000000000000 000B igen
8 Seek Time Performance 50 100 100 000000000000 0005
9 Power-On Time Count 0 87 87 0000000014C1 0032
10 Spin Retry Count 30 152 100 000000000000 0033 igen
12 Drive Power Cycle Count 0 100 100 0000000009EA 0032
192 Vendor-specific 0 100 100 000000000058 0032
193 Load/Unload Cycle Count 0 73 73 00000004218D 0032
194 HDD Temperature 0 100 100 003B00020024 0022
196 Reallocation Event Count 0 100 100 00000000000F 0032
197 Current Pending Sector Count 0 100 100 000000000004 0032
198 Off-Line Uncorrectable Sector Count 0 100 100 000000000000 0030
199 Ultra ATA CRC Error Count 0 200 200 000000000000 0032
220 Disk Shift 0 100 100 0000000000B3 0002
222 Loaded Hours 0 95 95 0000000007EA 0032
223 Load/Unload Retry Count 0 100 100 000000000000 0032
224 Load Friction 0 100 100 000000000000 0022
226 Load-in Time 0 100 100 00000000017F 0026
240 Head flying hours 1 100 100 000000000000 0001 igen

A BIOS által támogatott S.M.A.R.T. ellenőrzés problémát nem jelzett. A táblázatot áttanulmányozva látható, hogy az Érték oszlopban található számok (100, illetve a felettiek) a Küszöb értékektől nagyon távol állnak, sőt többségük (a 100-as értékek) el sem mozdult a maximális kondíciót jelző szintről. Emiatt a gyártóspecifikus értékek elemzésével a merevlemez nemhogy hibásnak nem mutatja magát, de a kondíciója tökéletesnek tűnik. A 100-nál alacsonyabb értékek a merevlemez működési idejéből adódnak, mindazonáltal a lemez összesen csak 5313 órát (0x14C1) töltött bekapcsolva (jelen merevlemeznél a teljes működési időt a gyártó vélhetőleg jól adta meg, azt kiszámítva nagyjából 4,7 évet kapunk napi 24 órás üzemmódban használva: (5313/0,13)/24/365 = 4,665 év). Tehát elhasználódásról még szó sem lehet.

Ezzel szemben a Hard Disk Sentinel értékelő algoritmusa segítségével egészen más eredményt kapunk. Mivel a kérdéses merevlemez egy hordozható számítógépben használt 2,5 hüvelykes példány, a szigorúbb értékelési módszer segítségével kerül értékelésre a merevlemez állapota. Az értékelésben részt vesznek azon attribútumok is, melyek funkciójuk szerint felelősek a lemez valós állapotáért – még ha azok a gyártó szerint nem is kritikusak.

A kondíció számítása (figyelembe véve az 5-ös, 196-os, 197-es attribútumok Adat mezőjében található értékeket):

100 x (100 – 10 x 6) x (100 – 30) x (100 – 4 x 4) = 23,52%

Az értékelés alapján a merevlemez kondíciója igencsak aggasztó. A szoftver alaphelyzetben ilyen kondíció esetén már figyelmeztet, hogy adatvesztés várható. A megfelelő számítási módszer kiválasztásával és a megfelelő riasztási szint beállításával még akár ennél korábban is jelezhető lett volna az adatvesztés ennél a merevlemeznél – ha a megfelelő szoftvert előzőleg telepítik.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

  • 750 GB-os nagymenők

    Négy gyártó 750 GB-os merevlemezeit teszteltük. Vajon a kapacitás növelése mellett más előnyökkel is jár a fejlesztés?

Előzmények

Hirdetés