Dois-je utiliser «Raid 5 + rechange» ou «Raid 6»?

12

Qu'est-ce que "Raid 5 + Spare" (extrait du manuel de l' utilisateur, section 4.17.2, P.54 ):

RAID5 + Spare: RAID 5 + Spare est une matrice RAID 5 dans laquelle un disque est utilisé comme disque de rechange pour reconstruire le système dès qu'un disque tombe en panne (Fig. 79). Au moins quatre disques sont nécessaires. Si un disque physique tombe en panne, les données restent disponibles car elles sont lues à partir des blocs de parité. Les données d'un disque défectueux sont reconstruites sur le disque de secours. Lorsqu'un disque défectueux est remplacé, le remplacement devient le nouveau disque de secours. Aucune donnée n'est perdue en cas de défaillance d'un seul disque, mais si un deuxième disque tombe en panne avant que le système puisse reconstruire les données sur le disque de secours, toutes les données de la baie seront perdues.


Qu'est-ce que "Raid 6" (extrait du manuel de l' utilisateur, section 4.17.2, P.54 ):

RAID6: en RAID 6, les données sont réparties sur tous les disques (minimum de quatre) et deux blocs de parité pour chaque bloc de données (p et q sur la figure 80) sont écrits sur la même bande. Si un disque physique tombe en panne, les données du disque défaillant peuvent être reconstruites sur un disque de remplacement. Ce mode Raid peut prendre en charge jusqu'à deux pannes de disque sans perte de données. RAID 6 permet une reconstruction plus rapide des données à partir d'un disque défaillant.


"Raid 5 + spare" et "Raid 6" sont tellement similaires ... Je ne peux pas faire la différence.

Quand "Raid 5 + Spare" serait-il optimal?

Et quand "Raid 6" serait-il optimal "?

Le manuel réduit les différents raids avec 5 étoiles. "Raid 5 + Spare" obtient seulement 4 étoiles mais "Raid 6" obtient 5 étoiles. Si je faisais aveuglément confiance au manuel, je conclurais que "Raid 6" est toujours mieux. "Raid 6" est-il toujours mieux?

Trevor Boyd Smith
la source
1
ServerFault a une bonne discussion à ce sujet.
Brian
1
Quoi que vous finissiez par faire, faites un raid uniquement avec un contrôleur de raid, pas avec le contrôleur logiciel intégré fourni avec votre mobo. Si votre mobo s'éteint, vous demandez des ennuis.
sound2man
Le raid est en train d'être interrompu par un contrôleur matériel (lol j'ai trop entendu de choses contre les contrôleurs logiciels raid).
Trevor Boyd Smith

Réponses:

17

En bref:

  • Si la sécurité est votre principale préoccupation, optez pour RAID6 car il peut survivre à deux disques défectueux en même temps. Si un disque tombe en panne dans un arrangement de rechange R5 +, vous n'êtes pas à l'abri d'une autre panne tant que le disque de rechange n'a pas été mis à niveau, ce qui pourrait prendre un certain temps avec de gros disques (et ce n'est pas inconnu pour un disque qui a été mis hors tension). pour les âges, comme votre pièce de rechange, à ne pas tourner quand on vous le demande enfin).

  • Si les performances sont au rendez-vous, optez pour 5 + rechange car les performances d'écriture seront meilleures lorsque la baie n'est pas dans un état dégradé - bien que la différence de performances entre R5 et R6 soit nettement inférieure à la différence entre R5 et d'autres solutions si vous avez un bon contrôleur (c.-à-d. une fois qui effectue une opération d'écriture de bloc partielle "deux / trois lectures simultanées puis calcul de parité puis deux / trois écritures simultanées" la plupart du temps plutôt que "lecture-puis-lecture (-then-read) -then-parity -calc-then-write-then-write (-then-write) ", ce que peuvent faire certains contrôleurs et logiciels RAID très bon marché.

Edit: j'ai raté un point potentiellement important la première fois:

  • Si la consommation d'énergie est un problème, le disque de rechange R5 + aura un avantage supplémentaire si votre contrôleur maintient le disque de secours hors tension jusqu'à ce qu'il soit nécessaire.
David Spillett
la source
Très bien écrit / concis. (Indique les avantages / inconvénients évidents dans les deux premiers mots de chaque puce ... très très bien).
Trevor Boyd Smith
Je serais curieux de savoir quand, si jamais, la consommation électrique d'un seul disque supplémentaire va vraiment être une "préoccupation" par rapport à tout le reste dans le centre de données / salle des serveurs / etc
warren
Un seul lecteur dans une seule machine, probablement pas. Mais dans colo où vous obtenez X-ampères par rack et payez beaucoup pour tout excès (ou l'excès n'est tout simplement pas autorisé - parfois si vous dépassez, vous tombez dans l'obscurité), cela pourrait être perceptible. La puissance "consommée" est également un double coup dur: elle est convertie en bruit et en chaleur et vous finissez par avoir besoin de plus de puissance pour éloigner la chaleur. Et pour une cage entière ou un ensemble de kits plus grand, le tirage total d'un lecteur supplémentaire par unité de calcul s'ajoute rapidement à quelque chose qu'un comptable suffisamment pointilleux pourrait remarquer.
David Spillett
7

RAID 5 + disque de secours:

  • sur un matériel de contrôleur égal, de meilleures performances que RAID 6
  • vous ne pouvez pas perdre 2 disques en même temps . lorsque vous perdez un disque, il y a un temps de reconstruction (avec le disque de secours) dans lequel vous n'avez aucune redondance . Tout ce qui échoue pendant cette période crée une perte complète (à moins d'envoyer tout à une bonne entreprise de récupération de données et de payer vraiment $$$$)

RAID 6:

  • performances moins bonnes que RAID 5 (selon le contrôleur, il peut varier de très sensible à pratiquement aucune différence)
  • vous pouvez perdre 2 disques en même temps

Pour tout RAID 5 ou 6, vous devez faire attention à utiliser des disques qui ne proviennent pas du même cycle de production. Il peut arriver (je l'ai vu!) Qu'après un seul échec lors de la reconstruction, le ou les disques suivants échouent en raison de l'augmentation du stress. Les disques d'une même exécution ont exactement le même micrologiciel et probablement des propriétés physiques très similaires.

Modifier: que choisir

(Cela dépend également des exigences de performances du serveur et du risque tolérable.)

Si l'environnement des serveurs est assez agréable pour le matériel (colo, climatisé, etc.), vous serez OK avec RAID5 + hot spare.

Si l'environnement rend plus probable que plusieurs disques tombent en panne en peu de temps (vibrations, humidité, saleté), optez pour RAID 6.

Ayez toujours une sauvegarde adéquate et testez la récupération.

Edit 2: les contrôleurs RAID décents ont un nettoyage , qui vérifie périodiquement tous les secteurs.

knitti
la source
+1 pour "avoir une sauvegarde adéquate et tester la récupération". C'est la PREMIÈRE chose que tout le monde devrait avoir avant de commencer à se soucier des niveaux RAID.
warren
3

RAID5 utilise une bande de parité. Il est nécessaire de calculer la correction d'erreur Reed Solomon et d'écrire deux bandes pour RAID6 contre une pour RAID5. RAID5 est utilisé pour les applications de base de données intenses où le stockage est énorme en raison du coût de RAID10. Le coût de RAID5 varie de 67% à 94% de disponibilité du disque, où RAID10 est de 50% (coûts de stockage beaucoup plus élevés) .Tandis que RAID6 a une latence de lecture plus faible d'une très petite quantité en raison de la latence de rotation, RAID6 est entre 25 et 31% plus lent sur les écritures en raison de le calcul de la correction d'erreur et l'écriture supplémentaire du bit de parité.

En utilisant le temps moyen entre pannes (MTBF) pour les disques, la probabilité que deux disques tombent en panne l'un après l'autre ou en même temps est d'environ (0.1% x 0.1%)*12ou 0.001 x 0.001 * 12; si vous avez 1000 disques en cours d'exécution, vous perdrez en moyenne ~ 1,2 disque par an. Deux disques tombent en panne l'un après l'autre environ tous les 8,3 ans. Maintenant, comme la défaillance du lecteur n'est pas une distribution de Poisson en raison des fortes charges sur le lecteur pendant la reconstruction, une défaillance d'un deuxième lecteur est plus susceptible de se produire pendant cette période, et la distribution est plus proche d'une distribution Gamma avec des valeurs légèrement plus élevées après un l'échec se produit.

En fin de compte, les performances de RAID5 sont supérieures à RAID6 sur les écritures et pour les applications DB - bien mieux. Pour une application principalement lue, comme un serveur Web, cela ne fait aucune différence et vous devez utiliser RAID6. Les avantages économiques de l'utilisation de RAID5 sur RAID10 sont énormes pour un stockage volumineux. Si vous pouvez vous permettre les frais généraux, utilisez RAID10 pour les applications très gourmandes en disque. RAID10 fonctionnera toujours mieux.

Le plus gros résultat manquant est que le RAID n'est PAS une sauvegarde, mais un moyen de limiter les temps d'arrêt en fournissant une redondance. Si les données sont critiques, vous devez les sauvegarder (et tester votre processus de récupération).

Si une matrice RAID de 10 disques SAS de 2 To tombe en panne, la récupération coûtera des milliers de dollars et prendra des semaines, même si elle peut être effectuée.

Toutes les baies RAID finissent par échouer!

Dr. Bombilious
la source
1

Parlant strictement du point de vue de l'intégrité des données, oui. Vous pouvez sans risque de perdre deux disques quelconques, bien qu'il soit un événement rare de perdre deux ensemble à court d' un traumatisme physique grave au système.

Financièrement, pas autant. Le disque de secours peut être mis hors tension jusqu'à ce qu'il soit nécessaire, ce qui signifie qu'il n'utilise pas de courant et ne subit aucune usure.

Et comme toujours, RAID ne remplace pas un plan de sauvegarde hors site approprié.

Ignacio Vazquez-Abrams
la source
1

Avez-vous pensé à 10? Si vous avez suffisamment de disques pour le raid 6, vous en avez assez pour faire un volume de 10. Dans la plupart des cas, 10 est à la fois plus rapide et plus redondant (au prix d'un peu d'espace disque).

Joel Coehoorn
la source
10 ne prend en charge que 4 disques. le raid 10 n'est donc pas une option OMI.
Trevor Boyd Smith
1
@Trevor Raid 10 prend en charge n'importe quel nombre pair de disques> = 4. Si vous pouvez faire le raid 6, vous pouvez faire le raid 10.
Joel Coehoorn
1

Ces réponses semblent incorrectes car elles sont basées UNIQUEMENT sur les performances théoriques du lecteur. Considérez que si vous avez un contrôleur RAID avec 1 Go de cache, l'écriture (généralement sous une charge normale - pas un scénario de charge élevée non normale massive) est immédiate du point de vue de l'utilisateur ou de l'application - elle est allée en mémoire, puis une écriture «réelle» se produit lors des performances du lecteur.

Cependant, la lecture ne peut pas être «truquée» (accélérée avec un cache) à moins que les mêmes données aient récemment ou habituellement déjà été chargées. Le raid 6 est meilleur pour la lecture et est plus tolérant (2 contre un disque). Raid 5 est une écriture plus lente et très lente lors de la reconstruction.

Ainsi, alors que RAID 5 serait lent dans l'écriture réelle, il sera caché avec un bon contrôleur de raid - où l'écriture se produit en mémoire du point de vue de l'utilisateur / application. Cependant, le raid 5 est une lecture plus lente que le raid 6 et cela ne sera pas amélioré avec un contrôleur à moins que les données aient déjà été chargées ou qu'un algorithme ne conserve un enregistrement des lectures répétées. Dans la vraie vie - le raid 6 gagne.

En conclusion, l'écriture de Raid 5 est lente mais cachée avec un bon contrôleur et cela rend le raid 5 ou 6 essentiellement le même avec des performances `` perçues '' en écriture (il y a quelques exceptions). Cependant, Raid 6 lit plus rapidement et les contrôleurs n'aideront probablement pas dans une charge de travail réelle à améliorer les performances de lecture. Ajoutez maintenant que Raid 6 peut prendre deux échecs et Raid 5 + 1 un seul, il devient facile de choisir Raid 6 comme meilleure option: n'oubliez pas que la reconstruction sur Raid 5 est également très lente. J'ai également appris que les disques Raid 6 sont utilisés (donc testés correctement) et que les disques qui échouent ont tendance à tomber très rapidement. Une fois qu'une baie fonctionne pendant plus de 30 jours, elle a tendance à durer des années. Un disque de secours n'est pas testé et peut en fait échouer immédiatement au moment opportun.

Trevor
la source
0

Ce sont les faits de l'affaire, et ils ne sont pas contestés (par quiconque sait de quoi ils parlent):

  1. RAID5 + hotspare est, littéralement, le pire choix RAID possible que vous puissiez choisir.
  2. RAID10 devrait être le choix par défaut si vous vous souciez de vos données (ce qui signifie que vous en dépendez, par exemple, pour faire fonctionner votre entreprise).

Si vous considérez toutes les options RAID possibles, il n'y a aucun cas dans lequel RAID5 + hotspare est le meilleur choix, principalement parce que si vous avez RAID5 + hotspare, cela signifie que vous avez 4 disques, et avec 4 disques, vous pouvez faire RAID6, ou même mieux, vous pouvez faire du RAID10.

Avec 4 disques, vous obtenez le même stockage utilisable dans tous les choix (R5 + HS, R6, R10).

Si votre objectif est la performance, alors RAID10 sera supérieur à RAID5 et RAID6.

Si votre objectif est la sécurité, RAID6 ou RAID10 sont supérieurs à RAID5 avec ou sans hotspare. Il est discutable de savoir lequel est le plus sûr (6 contre 10). RAID6 peut supporter 2 pannes de disque, mais en raison d'erreurs de lecture irrécupérables (URE), il est également possible qu'une seule panne de disque dans un RAID6 tue l'ensemble de la baie.

RAID10, car il n'est pas basé sur la parité, n'a pas le même problème avec les URE. Si un RAID de parité (R5, etc.) perd un lecteur, puis rencontre un URE, la matrice entière est perdue. Avec RAID1 ou RAID10, si un lecteur est perdu, puis qu'un URE est rencontré sur le disque miroir, seul le secteur illisible est perdu.

Voir ici pour une explication détaillée des raisons pour lesquelles RAID5 est le pire choix possible . Voir également ici pour une liste de choix RAID raisonnables par nombre de disques . Notez qu'en aucun cas RAID5 n'est le meilleur choix (quel que soit le hotspare).

user1594322
la source
2
Je ne suis pas d'accord. RAID5 a ses utilisations. (par exemple, lorsqu'un budget est serré et que vous avez vraiment besoin d'espace disque). Et comme le RAID ne remplace pas une sauvegarde survivant à une panne de disque, il y a beaucoup à vous dire jusqu'à 17 heures, moment où les gens quittent le bureau et vous effectuez la maintenance d'urgence.
Hennes
Il y a une différence entre «le meilleur choix» et «le meilleur choix que vous pouvez vous permettre». RAID5 n'est jamais le meilleur choix, jamais. Les gens viennent ici pour obtenir la meilleure réponse, et les gens devraient partir d'ici en sachant que RAID5 est toujours moins que le meilleur. Il est mathématiquement prouvable que dans certains cas, RAID0 est plus fiable que RAID5. Voilà comment le RAID5 fait peur. Dans de nombreux cas, le RAID5 peut ne pas arriver jusqu'à 17 heures. Il y a une grande différence entre la théorie et le monde réel en ce qui concerne RAID5. Voir ici
user1594322
Je ne comprends pas du tout pourquoi vous dites qu'un RAID10 n'a pas le même problème avec les URE. Avec une configuration RAID10 à quatre disques, si vous perdez un disque et souffrez d'un URE sur son miroir correspondant, vous êtes également arrosé.
ChrisInEdmonton
Si RAID10 a un disque défectueux, puis un URE sur le disque survivant, vous ne perdez que le secteur illisible, pas la totalité de la baie. Mis à jour la réponse.
user1594322