Root » Servers » » Harde schijf » » Voorkomen en herstellen van fouten » » Wees Smart!
Wees Smart
en voorkom diskfouten
SMART
De harde schijf houdt zijn fysische conditie bij. Deze gegevens kunnen ingelezen worden door aangepaste programma's. Helaas heeft Windows geen dergelijk programma standaard aan boord (Apple trouwens ook niet).
-

-

Wees SMART!

Het SMART controleprogramma op de harde schijf houdt bij hoe vaak de harde schijf opgestart is geweest (iedere start/stop-operatie doet de schijf een beetje slijten), hoe lang het duurt om de schijf op snelheid te brengen, hoeveel tracking-fouten er opgetreden zijn, hoeveel leesfouten, en dergelijke. Zelfs de maximale bedrijfstemperatuur, het aantal werkuren, de meegemaakte schokken worden bijgehouden. Deze gegevens zijn toegangkelijk voor ieder programma dat erom vraagt. De data is in een gestandardiseerd formaat beschikbaar. Het SMART-systeem (Self-Monitoring, Analysis and Reporting Technology) bestaat al sinds de eerste EIDE-schijven. Spijtig genoeg bevat Windows geen programma om deze gegevens op te halen.

Om deze gegevens op te halen heb je een klein extern programma nodig. Dit programma installeert zichzelf als service, zodat het altijd opgestart wordt als windows opstart. Om het uur (of een ander tijdstip, dat je zelf kan instellen) vraagt het programma de SMART-gegevens van de harde schijf. Dit gebeurt in een oogwenk zonder dat de gebruiker iets merkt. Als de gegevens gewijzigd zijn, worden de veranderingen op het scherm getoont.

Download HDD Health, een gratis programma (windows service) dat de toestand van je harde schijf bijhoudt. Het programma bevat geen spyware en is verder volkomen veilig.
Dit is de site van de maker: Panterasoft.
Er bestaan talrijke andere monitoring-programma's.

Op het overzicht zie je een paar van de parameters die de harde schijf ter beschikking stelt.

    Sommigen zijn gestandardiseerd:
  • start/stop count het aantal keren dat de schijf gestopt en gestart is,
    van belang bij de bepaling van de algemene slijtage
  • seek error rate het aantal positioneringsfouten, een eerste teken dat de schijf moeite heeft om zijn gegevens correct te lezen.
  • reallocated event count het aantal slechte sektoren (dan is het meestal al te laat).
  • Er zijn een 100-tal gestandardiseerde parameters
    ze worden echter niet allemaal gebruikt.
Andere parameters zijn eigen aan ieder fabrikant, maar je kan heel gemakkelijk te weten komen wat ze voorstellen want hun naam wordt meegegeven samen met de waarde. Nieuwe harde schijven in 2.5-inchmaat (die vooral toegepast worden in laptops en draagbare muziekplayers) hebben een G-sensor. Oorspronkelijk was die parameter niet voorzien!

Parameters worden onderverdeeld in:

  • ouderdomsparameters "old age": het aantal werkuren, de cumulatieve temperatuur (een warme schijf verslijt sneller).
    Ouderdomsparameters zoals de start-stop count geven niet noodzakelijk aan dat de schijf slechter wordt, maar deze parameters worden ook gebruikt om de algemene betrouwbaarheid van de schijf te bepalen.
  • voorbode parameters "pre-fail": ze geven aan dat de prestaties slechter worden: positioneringsfouten, leesfouten, moeite om op toeren te komen, trillingen,…
    Op zich is een positioneringsfout (seek error rate) geen teken dat de schijf defekt is (er gebeuren dorlopend dergelijke fouten), maar een verslechtering van de waarde is een teken dat de schijf minder betrouwbaar wordt.
  • foutparameters "CRITICAL": er is duidelijk iets aan het mislopen. Een reallocated event count geeft aan dat een sektor niet gelezen kon worden.

Sommige SMART parameters geven een absolute waarde aan: aantal keren opgestart (mechanisch: load/unload conditie), aantal slechte sektoren, aantal werkuren, aantal keren opgestart (electrisch: power on count), temperatuur,...

Maar ze kunnen ook een relatieve waarde aangeven (sommige parameters zijn trouwens enkel relatief): "Goed" is een hoge waarde, "slecht" is een lage waarde. De waarden zijn genormaliseerd en gaan van 1 tot 253). De fabrikant geeft voor iedere waarde een minimum-waarde aan (de treshold-waarde).


Voorspelling aan de hand van de SMART parameters

De software dat de parameters van de harde schijf opvraagt kan eveneens voorspellingen doen: als een parameter gemiddeld om de 10 dagen met één stap slechter wordt, dan kan de software bepalen wanneer de waarde beneden het minimum dat door de fabrikant vooropgesteld werd zal komen. Op zich is dit geen teken dat de schijf "defekt" is, maar het geeft wel aan dat de betrouwbaarheid van de schijf minder is geworden. Critische fouten, als die optreden, doen altijd de bijhorende parameter onder de minimum-waarde zakken.

TEC: Threshold Exceed Condition
datum waarop de parameter beneden de minimum-waarde vooropgested door de fabrikant zal komen (of reeds gekomen is)
Value
Dit is de huidige genormaliseerde waarde
Threshold
Genormaliseerde waarde dat door de fabrikant als minimum-waarde aangegeven wordt.
Worst
Dit is de laagste waarde dat de parameter ooit berekt heeft. bepaalde parameters kunnen zich namelijk herstellen (bijvoorbeeld procentuele leesfouten door extreme warmte: als de temperatuur daalt, dan daalt ook het aantal procentuele leesfouten)
Increment
Verandering van de parameter ten opzichte van de vorige meting. Het is normaal dat sommige parameters lichtjes variëren.

Ontstaan van een foutconditie

Een kritieke fout gebeurt niet zomaar (behalve als je de schijf zou laten vallen, of er is blikseminslag). Er zijn een aantal precondities die optreden.
  1. Verslechtering van de pre-fail parameters
    Fouten gebeuren geleidelijk: eerst zullen er meer tracking-fouten gebeuren (de kop komt op de verkeerde spoor terecht), of het signaal wordt niet bij de eerste doorgang gelezen, of de foutcorrectie heeft in gang moeten treden om de fout te verbeteren. De gegevens konden nog gelezen worden, maar de situatie kan verergeren. Windows zelf is niet op de hoogte van deze mankementen.
  2. Verslechtering van de critical parameters
    De controller kan beslissen om de borderline sektoren te verplaatsen naar een spare area. Borderline sektoren zijn sektoren die zo slecht leesbaar zijn dat ze misschien niet meer bruikbaar zullen zijn in de toekomst. Spare sectoren zijn sektoren die in reserve gehouden worden en normaal niet gebruikt worden. De omzetting gebeurt volledig transparent: windows weet niet dat de gegevens dat hij zojuist ontvangen heeft afkomstig zijn van een reserve spoor. Windows weet nog altijd niet dat de harde schijf nagenoeg defekt is.
  3. Eerste hard errors
    Als de betrouwbaarheit van de schijf slechter wordt, dan gebeuren er de eerste hard errors. Dit zijn fouten die niet hersteld kunnen worden. Windows krijgt nul op zijn request om een block te lezen. Windows blijft in het algemeen verder werken (er worden zoveel onbelangrijke componenten geladen, dat je 50% van het operating system zou kunnen weghalen en windows zou nog blijven werken!) Als de situatie verslechtert kan windows vastlopen. In geen enkele stap houdt windows rekening met het feit dat de schijf slecht zou kunnen worden. Van windows zal je dan ook geen waarschuwing krijgen als de eerste hard errors optreden: windows blijft werken, totdat het te laat is.
  4. Systeem start niet meer op
    Er zijn ondertussen zoveel fouten opgetreden dat windows niet meer kan opstarten. Het is in deze conditie dat de gebruiker zijn computer binnenbrengt voor nazicht. Meestal is de situatie zo erg dat het operating system en de programma's (office, mail,…) niet meer te redden zijn. Gegevens kunnen nog in beperkte mate gerecupereerd worden. Bij windows vista en 7 is dit bijna niet meer mogelijk, wegens de bestandsrechten die verschillend zijn van vroegere filesystemen. Zelfs als het ergste gebeurt is, is windows van weinig hulp.

Publicités - Reklame

-