La sauvegarde des données: les disques RAID

Publié le 19 mai 2008 par Vehotech

Enregistrer ses données sur son disque dur puis les sauvegarder ensuite sur un autre support, qu’il s’agisse d’un disque amovible ou d’un serveur en ligne, c’est bien.

Enregistrer ses données sur son disque dur et faire en sorte qu’en même temps elles soient sauvegardées en temps réel, cela semble encore mieux. Et c’est bien le principe de ce que l’on appelle le RAID (Redundant Array of Inexpensive Disks), qui consiste à réunir plusieurs disques durs physiques dans un disque logique avec des caractéristiques qui lui sont propres en matière de sauvegarde des données.

Il existe de nombreux niveaux de RAID, qui peuvent également être combinés entre eux, mais je ne vais vous exposer que ceux qui sont proposés aujourd’hui au particulier, c'est-à-dire le RAID 1, le RAID 5 et le RAID 6.

Le RAID 1

L’idée qui gouverne le RAID 1, c’est que plutôt que d’enregistrer les données sur un disque, on peut les enregistrer sur deux. Toutes les informations vont donc être écrites deux fois, de façon exactement similaire, sur deux disques durs. De cette manière, si l’un des deux disques dur tombe en panne, son jumeau est toujours disponible avec l’intégralité de vos données.

En résumé, le RAID 1 c’est :

- 2 disques durs au minimum.

- Capacité disponible : égale à celle d’1 disque dur.

- Caractéristiques : Sauvegarde des données qui sont enregistrées intégralement deux fois, la panne d’un disque dur est sans conséquence.

Le RAID 5 et le RAID 6

Avant de vous expliquer la différence entre ces deux niveaux de RAID, je vais vous expliquer ce qui les rapproche. Tous deux utilisent ce que l’on appelle le calcul de parité. Vous trouverez sur internet des explications extrêmement détaillées et compliquées sur ce principe, hors de portée du commun des mortels... Enfin, hors de ma portée. Alors laissez-moi vous l’expliquer à ma manière.

Le RAID 5

Imaginons que vous disposez de trois disques durs.

Vous enregistrez des informations, imaginons le chiffre 1 et le chiffre 2. Chiffre 1 sur le disque 1, chiffre 2 sur le disque 2, et votre ordinateur sauvegarde également la somme, soit le chiffre 3 sur le disque 3.

Imaginez maintenant que l’un de vos disques tombe en panne. Vous le retirez de votre système, et le remplacez par un autre. A cet instant, votre ordinateur va être capable de reconstruire les données qui étaient présentes sur le disque défectueux en effectuant de simples opérations arithmétiques. Bon, simples pour lui, bien sûr ! Pour continuer notre exemple :

- Si c’est le disque 3 qui était défectueux, il suffit d’additionner le 1 sur le disque 1 et le 2 sur le disque 2 pour reconstruire le 3 sur le nouveau disque 3.

- Si c’est le disque 2 qui était défectueux, il suffit de soustraire le 1 du disque 1 au 3 du disque 3 pour reconstruire le 2 sur le nouveau disque 2.

- Si c’est le disque 1 qui était défectueux, il suffit de soustraire le 2 du disque 2 au 3 du disque 3 pour reconstruire le 1 sur le nouveau disque 1.

Bien sûr, il n’y a pas de disque réservé à l’enregistrement de la parité. Tous les disques peuvent contenir la donnée 1, la donnée 2 ou la somme 3.

En résumé, le RAID 5 c’est :

- 3 disques durs au minimum.

- Capacité disponible : égale à la somme de la capacité totale des disques durs, moins la capacité d'un disque.

- Caractéristiques : Sauvegarde des données avec optimisation de la place utilisée, la panne d’un disque dur est sans conséquence.

Le RAID 6

Imaginons que vous disposez de quatre disques durs.

Vous enregistrez des informations, imaginons le chiffre 1, et le chiffre 2. Chiffre 1 sur le disque 1, chiffre 2 sur le disque 2, et votre ordinateur sauvegarde également la somme, soit le chiffre 3 sur le disque 3, ainsi que la différence, soit le chiffre 1 sur le disque 4.

Imaginez maintenant que deux de vos disques tombent en panne en même temps. Vous les retirez de votre système, et les remplacez par deux autres. A cet instant, votre ordinateur va être capable de reconstruire les données qui étaient présentes sur les deux disques défectueux en effectuant à nouveau de «simples » opérations arithmétiques.

Là encore, il n’y a pas de disque réservé à l’enregistrement de la parité. Tous les disques peuvent contenir la donnée 1, la donnée 2, la somme 3 ou la différence 1.

En résumé, le RAID 6 c’est :

- 4 disques durs au minimum.

- Capacité disponible : égale à la somme de la capacité totale des disques durs, moins la capacité de deux disques.

- Caractéristiques : Sauvegarde des données avec optimisation de la place utilisée, la panne simultanée de deux disques durs est sans conséquence.

Les inconvénients de la sauvegarde en niveaux de RAID
Le coût.

Dans tous les cas, vous achetez des disques durs sans disposer en termes de stockage de la somme des capacités des disques durs achetés. En RAID 1, par exemple, vous avez acheté deux disques, mais vous n’en disposez réellement que d’un.

L’excès de confiance.

La sauvegarde en RAID est extrêmement fiable et vous protège de la défaillance d’un ou de plusieurs disques durs, selon le niveau choisi. Mais elle ne vous protège ni des erreurs humaines (malveillance ou non), ni ne vous met à l’abri en cas de sinistre (incendie).

Pourquoi ne pas avoir parlé du RAID 0?

Vous entendrez également régulièrement évoquer le RAID 0, très courant, mais qui ne nous intéresse pas aujourd’hui puisqu’il ne permet pas de sauvegarder ses données. En RAID 0, il s’agit simplement de diviser en deux paquets les informations que vous souhaitez enregistrer, et d’enregistrer chaque paquet sur un disque dur distinct. L’opération prend deux fois moins de temps que si vous enregistrez sur un seul disque, mais aucune sauvegarde de vos données n’est effectuée.

En résumé, le RAID 0 c’est :

- 2 disques durs au minimum.

- Capacité disponible : égale à la somme des capacités des disques durs.

- Caractéristiques : vitesse d’enregistrement divisée par 2, pas de sauvegarde des données, et si l'un des disques est défectueux, l'ensemble des données est perdu.