RAID : redondance de disques

malekalmorte

Date création :

23 décembre 2019

Dernière modification :

RAID signifie Redundant Array of Inexpensive disks, que l’on peut traduire cela par Réseau redondant de disques bon marché.
Il s’agit de créer un système de redondances de données peu cher.
Cela afin d’éviter la perte de données ou améliorer les performances.
Ce procédé peut s’utiliser sur des serveurs de données ou par des NAS (Network Attached Storage).

Cet article donne les grandes lignes du RAID notamment les différents RAID comme RAID-0, RAID-1 et RAID-10.

RAID : redondance de  disques dur

Qu’est-ce qu’un RAID ?

Il s’agit d’un groupe de disques qui fonctionnent ensemble.
Le but est de sécuriser et éviter la perte de données mais aussi parfois d’améliorer les performances.
Par exemple gagner en temps d’écriture ou lecture.
Enfin ils sont utilisés lorsque nous avons besoin d’excellentes performances.

Le Raid est une collection de disques dans un pool qui devient alors un volume logique.
C’est à dire que le groupe de disque est invisible et ne forme que un ou plusieurs lecteurs.
Un contrôle gère la structure du RAID.
Ce dernier peut-être matériel via une carte dans le PC ou logiciel.
Il vérifie la cohérence des données et la structure.
Enfin il peut aussi détecter les pannes matériels.

Enfin il existe plusieurs niveaux (level) de RAID avec des avantages et inconvénients.

Que ce soit pour la récupération de données ou les performances.
Ainsi selon les besoins performances, protection des données, temps de reconstruction, il faut bien choisir le type de RAID.

Quels sont les utilisations du RAID ?

Le RAID s’utilise pour les serveurs, par exemple un serveur de fichiers, un serveur WEB ou de base de données.
Cela afin d’éviter la perte de données.
Par exemple ci dessous, une lame de serveurs que l’on retrouve dans les datacenter (centre de données).

Serveur dans un datacenter

Mais on peut aussi utiliser le RAID dans les baies de disques et de stockage.
Par exemple pour la sauvegarde réseau ou l’archivage.

Une baie de stockage ou disques

Enfin pour le grand public, on utilise le RAID dans les NAS.
Les serveurs de fichiers réseaux.

Les NAS : serveur de fichier réseau

Le raid logiciel ou matériel

Chaque OS comme Windows ou Linux proposent un RAID logiciel.
Les performances sont moindres car cela consomme des ressources.
Par contre, il ne coûte rien puisque l’OS embarque tout ce qu’il faut pour créer et gérer le RAID.

Les RAID matériels se présentent sous la forme d’une carte PCI ou d’un contrôleur présent dans la carte mère.
Dans le premier cas, elle possède sa propre unité de calcul et mémoire.
Ainsi Ils ne consomment aucune ressource puisque le contrôleur gère tout.
Un contrôleur RAID de la carte mère va utiliser le processeur du PC et donc utiliser les ressources de ce dernier.
Sur Linux, on peut utiliser MDADM ou LVM.
Plus d’informations mdadm : créer, gérer un RAID sur Linux.
Sur Windows 10, cela se fait avec l’espace de stockage : Windows 10 : créer un espace de stockage (pool de disques)

De plus, il possède un cache (NVRAM) qui accélère l’écriture et la lecture.
Mais ce sont les solutions les plus onéreuses.

Un contrôleur de RAID matériel

Les type et niveaux de RAID

Ensuite il existe différents types de RAID.
Cela dépend du nombre de disques disponibles et des groupes de disque que l’on peut constituer.
Chacun a des propriétés différents et des avantages et inconvénients.

Les types

  • Parité : il s’agit de reconstituer les données perdues à partir de la parité (checksum). Le RAID 5 et 6 utilise ce système.
  • Bande (Stripe) : Les données sont partagés entre les disques et aucun ne possède toutes les données.
  • Miroir : Les disques sont des copies de l’autre.
  • Hot Spare (changement à chaud) : C’est le remplacement à chaud d’un disque, c’est à dire sans couper le serveur.

On détaille ces propriétés dans les niveaux de RAID plus bas dans cet article.

Les niveaux

Les niveaux sont des numéros que l’on attribue à un RAID.
Ils reprennent alors les types précédents.
Soit donc :

  • RAID0 = volume agrégé par bandes (Striping)
  • RAID1 = Miroir
  • RAID5 = La parité est distribuée sur chaque disque
  • RAID6 = Double parité
  • RAID10 = Il combine à la fois le miroir et les volumes agrégés par bande.

RAID 0 : volume agrégé par bandes

Avec la méthode stripping, la moitié des données se trouvent sur chaque disque.
Imagions deux disques où l’on souhaite écrire MALEKAL.
Le M sera écrit sur le premier disque, A sur le second.
Puis le L sur le premier, le E sur le second.
Et ainsi de suite.

Les performances sont excellentes car les disques pourront travailler en même temps.
Par contre, si un des deux disques tombent, vous perdez la moitié des données.

Les propriétés :

  • Haute performance
  • Il n’y a aucune perte de capacité en RAID 0
  • Tolérance zéro
  • L’écriture et la lecture seront de bonnes performances

RAID 1 ou miroir

Il s’agit donc de copier le même contenus sur chaque disque.
Par exemple vous avez deux disques de 4 To.
Vous pouvez créer un miroir de 4 To avec au final un lecteur logique de 4 To.
Les deux disques seront alors identiques.

Le RAID 1 par miroir

Ici on perd la moitié de l’espace disque.
Le bon côté, c’est que vous avez une copie permanente des données.
Toutefois, cela ne protège pas à 100%.
En effet, si les deux disques tombent au même moment, vous perdez les données.

On l’utilisait surtout dans le passé pour sa vitesse.
Aujourd’hui ce type de RAID n’est plus très utilisé avec les SSD.

  • Bonne performance
  • La moitié de l’espace sera perdue en capacité totale
  • Tolérance aux pannes totale
  • La reconstruction est rapide. Vous remplacez un des deux disques, ils se reconstituent avec l’autre
  • Les performances d’écriture sont lentes car chaque disque écrit en même temps
  • La lecture sera bonne
  • Peut être utilisé pour les systèmes d’exploitation et les bases de données à petite échelle

RAID 5 : parité distribuée

C’est le RAID le plus utilisé en entreprise et dans les NAS.
Chaque disque possède un secteur de parité.
Par exemple, si vous avez 4 disques de 1 To.
768 Go seront utilisés pour les données et 256 Go pour la parité.

Lorsqu’un disque tombe, le RAID se reconstruit à partir de la parité des trois autres disques.

Le RAID 5 : la parité distribuée

Ainsi ce type :

  • Ce système nécessite impérativement un minimum de trois disques durs.
  • Il ne survit qu’à la perte d’un seul disque. Si l’on perd deux disques en même temps alors perd des données.
  • La reconstruction du RAID peut être longue. Plusieurs heures pour un disque de plus de 1 To. Cela augmente les chances de perdre de données.
Ainsi le RAID 5 ne survit qu’à la perte d’un seul disque.

Les propriétés :

  • Performance excellente
  • La lecture sera extrêmement très bonne en vitesse
  • L’écriture sera moyenne, lente si nous n’utilisons pas de contrôleur RAID matériel
  • Reconstruction à partir des informations de parité de tous les lecteurs
  • Tolérance aux pannes totale
  • 1 disque sera sous parité
  • Peut être utilisé dans les serveurs de fichiers, les serveurs Web, les sauvegardes très importantes

Le RAID 6 règle le problème de la perte de disque.
En effet, il intègre une double parité mais cela demande un disque dur supplémentaire.
Enfin cela baisse les performances en écriture.

RAID 10 : volume agrégé par bandes à parité répartie

C’est la combinaison du volume agrégé par bandes et la parité répartie.
C’est donc un mélange du RAID 1 et 0.
On utilise pour cela un groupe de chaque type de RAID.
On les nomes grappes ou Array.
Au minimum on a deux grappes des deux types.

On voit ici que la perte de données intervient si deux disques d’une même grappe tombe en même temps.
Les chances sont minces.
Mais surtout, les performances sont accrus par rapport à un RAID 5.
Par contre le coût est plus élevé puisqu’il faut un disque supplémentaire.

Le RAID 10 : le volume agrégé par bandes à parité répartie

Enfin on peut multiplier les grappes à l’infini.

Les propriétés :

  • Bonnes performances de lecture et d’écriture
  • Ici, la moitié de l’espace sera perdue en capacité totale
  • Tolérance aux pannes
  • Reconstruction rapide à partir de la copie de données
  • Peut être utilisé dans le stockage de base de données pour des performances et une disponibilité élevées

Comparatif des types de RAID

Type de RAIDNombre de disquesTolérance aux pannes de disqueCapacité
Unique10Capacité de disque combinée
JBOD (just a bunch of disks, soit plusieurs disques ensemble)≥ 20Capacité totale du disque combiné
RAID 0≥ 20Capacité totale du disque combiné
RAID 121La moitié de la capacité totale des disques combinés
RAID 5≥ 31Nombre total de disques moins 1 disque
RAID 6≥ 42Nombre total de disques moins 2 disques
RAID 10≥ 4 (Doit être un nombre pair)1 par paire de disquesLa moitié de la capacité totale des disques combinés
RAID 50≥ 61 par sous-groupe de disqueCapacité totale combinée du disque moins 1 disque par sous-groupe
RAID 60≥ 82 par sous-groupe de disqueCapacité totale des disques combinés moins 2 disques par sous-groupe
Comparatif des différents types de RAID

Liens et sources

Enfin les articles du site en rapport avec les sauvegardes ou stockage.

Les sources :

A propros de malekalmorte

malekal-site-logo-150

Passionné par l'informatique depuis très jeune, j'aide les internautes sur les forums depuis 2005 pour résoudre leurs tracas informatiques.
Je vous propose par la même occasion ce site avec de nombreux tutoriels pour vous aider aussi à résoudre de manière autonome les problèmes informatiques du quotidien.