RAID avec parité

RAID complexe

Le RAID avec calcul de la parité

RAID

Root » Serveurs » Electro-ménager » Ordinateurs » Disques durs » RAID » RAID complexes avec calcul de parité

Nous décrivons ici les versions plus complexes des systèmes RAID. Ces systèmes utilisent tous un bloc de parité.

Les codes-couleur

Disque physique		Disque logique		Partition		Stripe

Disques physiques: Ce que vous voyez quand vous ouverz l'ordinateur
Disques logiques: Ce que le système d'exploitation voit
Partition: Division d'un disque logique
Stripe: Unité élémentaire de stockage

RAID-2, RAID-3 en RAID-4

Il s'agit de systèmes que ne sont actuellement plus utilisés.

Le système RAID-2 utilise simultamément plusieurs disques, l'entrelacage s'effectue au niveau des bits. Le code Hamming permet de corriger les erreurs. Un système RAID 2 utilise normalement 7 disques, 4 pour les données et 3 pour la correction. Tous les disques ont maintenent une correction intégrée (40 bytes pour un bloc de 512 bytes), ce qui fait que ce RAID fait double emploi.

Le RAID-3 utilise un controle de parité par byte. Pour que le système soit suffisamment rapide, il faut que les disques tournent en synchronisme (lockstep mode), ce qui doit aussi être le cas avec le RAID 2.

Le RAID-4 utilise des bandes plus grandes (au minimum un bloc ou secteur du disque), cela évite que les disques ne doivent fonctionner en mode synchrone. Le disque de parité est fortement sollicité en écriture, car il doit être mis à jour à chaque modification d'un des blocs de la bande. Ce système est maintenant remplacé par le RAID-5.

Disk 1	1	4	7	10

Disk 2	2	5	8	11

Disk 3	3	6	9	12

Disk 4	Par.	Par.	Par.	Par.

Les blocs de parité permettent de reconstruire les données manquantes quand un disque est défectueux. Les blocs de parité ne sont pas utilisés en lecture tant qu'il n'y a pas de condition d'erreur. La détection d'une condition d'erreur se fait par le controlleur qui minute le temps mis par un disque à fournir le résultat. Si le temps dépasse une limite, le disque est mis hors-fonction (alors qu'il s'agit peut-être que d'une erreur sur un seul secteur).

Le code Hamming permet de détecter automatiquement les erreurs sans devoir attendre un time-out. Le fonctionnement en mode dégradé est lent si un des disques de données est touché, car il faut lire toute la bande (tous les disques) et utiliser la parité pour calculer les données manquantes.

RAID-5

Le RAID 5 est le système complexe le plus souvent utilisé. Les données sont également découpées en bandes et placées sur les disques consécutifs (comme un RAID 0), mais on intercale régulièrement un bloc de parité. Au contraire du RAID 4, on ne place pas la parité sur un seul disque.

Ce système est idéal pour lire de grands fichiers, car les différents disques fournissent simultanément leurs données, qui sont ensuite intégrées par le controlleur. Le gain n'est pas aussi grand qu'avec le RAID 0, puisque le bloc de parité n'est pas utilisé. L'écriture est plus lente qu'avec des disques non-RAID puisqu'il faut à chaque fois calculer et écrire la parité. Pour calculer la parité, il faut lire toutes les bandes.

Le système continue a fonctionner en mode dégradé (très lent) quand un disque est défaillant. Il faut un minimum de 3 disques pour un RAID 5. On utilise ce RAID dans les applications où il y a très peu d'écritures et beaucoup de lectures.

La reconstruction de la matrice RAID après remplacement d'un disque défectueux est lente (24 heures), pendant tout ce temps le système travaille en mode dégradé.

Disk 1	1	4	7	Par.

Disk 2	2	5	Par.	10

Disk 3	3	Par.	8	11

Disk 4	Par.	6	9	12

RAID-6

Le RAID 6 utilise 2 blocs de parité et permet la défaillance de deux disques. Ce RAID n'est utilisé que dans les systèmes les plus onéreux. Le calcul de la parité (ainsi que l'intégration d'un disque remplacé) demande nettement plus de temps.

La raison pour laquelle on utilise deux disques de réserve est simple: tous les disques du système travaillent en continu et subissent exactement les même contraintes. Quand un disque tombe en panne, il y a de grandes chances que les autres disques soient aussi au bout du rouleau. La reconstruction de la matrice après remplacement d'un disque est lente et si une panne se produit alors que la reconstruction n'est pas terminée, on perd toutes les données. Plus il y a de disques dans la matrice, et plus il y a de chances qu'un second disque tombe en panne. Le RAID 6 permet une panne de 2 disques (il fonctionne alors sans filet de sauvetage) pendant toute la durée de la reconstruction.

Publicités - Reklame