Root » Servers » Harde schijf » SSD | SMART » Parameters
Ook voor Solid State Disks
Betekenis van de smart parameters
Smart for SSD
Ook SSD schijven verslijten: het aantal schrijfcycli is namelijk beperkt. De controller kan bijhouden hoe vaak de cellen geschreven werden: dit is een goede graadmeter voor de betrouwbaarheid van de schijf. De schijf heeft een aantal reserve-cellen, want reeds bij de fabrikage zijn een aantal cellen defekt. Het aantal defekte cellen zal altijd groter worden en vormt ook een betrouwbaarheidsindex.
-

-


SMART status SSD Patriot
Bij deze SSD van patriot blijven alle parameters op hun maximale waarde (zelfs nar 3 jaar redelijk intensief gebruik), wat twijfels doet rijzen in verband met de betrouwbaarheid van de SMART parameters. Zelfs het aantal werkuren wordt niet aangepast!
Zoals alle harde schijven geven SSD's ook een SMART-status aan. In een zekere zin is dit ook te begrijpen, want deze schijven verslijten ook (zij het zeer langzaam en enkel bij het schrijven). De meeste parameters zijn echter nog niet gestandardiseerd, waardoor de SMART software niet kan zeggen wat de parameters betekenen. In het algemeen is het wel zo dat hoe lager de waarde, hoe slechter het gesteld is met de drive (behalve de temperatuur!). Een voordeel van SSD ten opzichte van HDD is dat de slijtage meer geleidelijk is (een harde schijf kan plots heel snel achteruit gaan). Fouten gebeuren bij het schrijven (bij SSD), en die kunnen opgevangen worden door controller (gegevens worden op spare sectoren geschreven). Bij HDD worden de fouten gedetecteerd bij het lezen, en dan zijn de gegevens meestal niet meer opvraagbaar.

Nu is het wel zo dat de betrouwbaarheid van een SSD vele malen hoger ligt dan die van een harde schijf (vooral bij mobiel gebruik in een laptop). Een SSD heeft geen bewegende delen, geen magnetische plateau's die aan 5400 of 7200 toeren per minuut draaien.

Op de SSD wordt intern bijgehouden hoe vaak een cel geschreven wordt, en door middel van wear levelling algeritmes wordt ervoor gezorgd dat de schrijfbelasting verdeeld wordt over alle cellen. Dit is bijvoorbeeld het geval voor filesystems die op de FAT-onderverdeling gebaseerd zijn: bij nagenoeg alle schrijfopdrachten wordt de FAT aangepast, en op een harde schijf heeft die een vaste plaats. De controller van de SSD zorgt ervoor dat de data op eenvolgende plaatsen geschreven wordt (ongeacht de lokatie die door de computer aangevraagd wordt). In de SSD is er een vertalingstabel die de blokpositie (aangevraagd door de computer) vertaald in een effectieve celpositie.

De SMART parameters werden opgesteld voor de komst van de Solid State Disk. Een groot aantal parameters heeft dus geen zin meer, zoals de spin up time.

  • De absolute waarde (raw value) is bij een SSD altijd nul en
  • de waardeparameter (normalised value) blijft altijd op 100 staan.

Voor de overige parameters is het ieder voor zich, met weinig gedocumentarieerde paramaters.

  • INTEL geeft een goede beschrijving van de gebruikte parameters. Andere fabrikanten gebruiken een subset van de INTEL parameters, maar beschrijven deze niet.
  • OCZ heeft ook een lijst gebruikte smart-parameters, maar die komen nauwelijks overeen met de INTEL parameters. Er zijn ook nog verschillen tussen de drives onderling (vertex-II, vertex-III, enz).
  • Samsung gebruikt een aantal gestandardiseerde parameters (zowel uit de tijd van de klassieke harde schijf als de recentere SSD-only parameters).

Bij iedere parameter wordt door middel van flags aangegeven wat voor soort parameter het is. Een parameter kan meerdere kenmerken (flags) hebben:
SP
Self Preserving
Dit kenmerk wordt bewaard op de schijf en gaat niet verloren bij stroomonderbreking (de meeste parameters zijn "self preserving")

EC
Event Count
Dit parameter telt een gebeurtenis, bijvoorbeeld het aantal werkuren, het aantal keren opgestart, maar ook het aantal leesfouten en schrijffouten.

ER
Error Rate
Geeft het aantal foutcondities aan (bijvoorbeeld het aantal leesfouten). De parameters met de ER flag aan moeten in de gaten gehouden moet worden bij het ebrekenen van de betrouwbaarheid van de disk in de toekomst. De error rate geeft alle fouten aan, zowel niet-kritieke (kon gecorrigeerd worden) als de kritieke.

PE
Performance
De parameters met de ER frag aan geven de fysieke conditie van de schijf weer. Bij een klassieke schijf hoort de spin up time bij de performance flags (de tijd nodig om de plateua's aan de juiste snelheid te laten draaien). Een vermindering van de prestaties (performance) kan aangeven dat de schijf versleten is.

OC
Online collection
De parameter met een OC flag wordt bijgehouden tijdens de normale werking van de schijf. Een beperkt aantal parameters worden enkel bepaald tijdens een offline test (een speciale modus van de harde schijf).

PW
Prefail Warranty
Een parameter met een PW flag geeft een vermindering van de betrouwbaarheid weer. Bij de verslechtering van een parameter met het PW attribuut moet de schijf vervangen worden.

De fabrikant is vrij in het kiezen van de flags: bij één fabrikant kan een parameter kritisch zijn, bij een andere niet. De PW parameters (en in mindere mate de ER parameters) geven de betrouwbaarheid in de toekomst weer van de schijf en zijn dus zeer belangrijk.


We zijn 6 jaar later sinds deze tekst geschreven werd, en ondertussen is er veel veranderd. De capaciteit is gegaan van 64GB naar 1TB of meer en de moderne SSD schijven die volgens het NVMe (non volatile memory express) werken hebben geen SMART mogelijkheid meer.

SMART was voorzien voor de schijven met de ATA en de latere SATA aansluiting. We zijn nu 30 jaar later na het onstaan van de SSD technologie, de mechanische schijven hebben plaats moeten ruimen voor de solid state disks.

Het smart-protocol is nooit echt doorgebroken voor SSD's, en dat is ook de fout van de fabrikanten. Bepaalde bedrijven zoals Intel geven de smart parameters correct door, maar bij andere bedrijven blijft de status permanent op 100 staan, zelfs als de schijf duidelijke gebreken vertoont. De smart status wordt dus niet bijgewerkt als de schijf defekt dreigt te gaan, ik heb al meermalen schijven gezien die bijna niet meer te lezen zijn, maar waarvan de smart status OK is. Het is waarschijnlijk daarom dat het smart protocol niet overgenomen is in de laatste generatie geheugenmodules.

De enige oplossing is op regelmatige tijdstippen de snelheid van de schijf te meten (hoewel dit ook geen absolute zekerheid geeft). Als de geheugenmodule meer tijd nodig heeft om bepaalde "sectoren" te lezen, dan is dit een teken dat de schijf aan vervanging toe is. Als de schijf defekt gaat, wordt eerst het schrijven onmogelijk, maar ook het lezen wordt trager omdat de blokken meerdere moeten gelezen worden en de foutcorrectie moet ingrijpen. Om fouten te detecteren moeten er voldoende blokken gelezen worden (1000 is een goed getal).

Rechts: schijf die een normale snelheid van 540MB/s had heeft nu een gemiddelde snelheid van 200MB, met plaatsen waarbij de snelheid onder de 50MB/s ligt. Deze schijf is duidelijk aan vervanging toe, alhoewel de smart status aangeeft dat er niets aan de hand is.

Publicités - Reklame

-