Quels sont les principaux points pour éviter RAID5 avec SSD?

16

Ma compréhension est qu'un SSD a un nombre limité d'écritures. RAID5 effectue de nombreuses écritures en raison des informations de parité sur les disques. Le raisonnement indique donc que RAID5 tuerait et diminuerait les performances des disques SSD à un rythme plus rapide.

La déclaration suivante de cet article , me fait penser que je ne comprends pas complètement ou peut être incorrect avec mon raisonnement ci-dessus.

Un autre créneau pour les SSD à haute endurance est dans les matrices RAID à parité. SLC, en raison de sa latence d'écriture et de son endurance intrinsèquement supérieures, est bien adapté à ce type d'application.

Damainman
la source
1
Vous devez vous rappeler combien d'écritures il faut pour tuer un SSD ... Quelque chose comme 1 ou 1,5 million pour les SSD grand public.
Chad Harrison
@hydroparadise Les SSD grand public actuels (juin 2013, 20 nm MLC) ont une capacité flash d'environ 3000 cycles d'écriture / effacement. Ils n'arrêtent pas de travailler immédiatement après 3000 écritures complètes, mais ils échoueront bien plus tôt qu'un million d'écritures.
Daniel Lawson

Réponses:

11

Votre raisonnement est correct, même si vous manquez l'ampleur du problème.

Les disques SSD d'entreprise sont fabriqués avec des cellules MLC à endurance supérieure et peuvent tolérer des taux d'écriture très élevés. Le SLC souffle toujours le MLC de haute endurance hors de l'eau, mais dans la plupart des cas, la durée de vie en écriture du HE-MLC dépasse la durée de vie opérationnelle attendue d'un SSD.

Ces jours-ci, l'endurance est répertoriée comme «Écritures à vie» sur les fiches techniques.

À titre d'exemple, la gamme SSD Seagate 600 Pro en contient une liste, à peu près:

Model   Endurance
100GB       220TB
200GB       520TB
400GB      1080TB

Compte tenu d'une durée de vie opérationnelle de 5 ans, pour atteindre l'endurance indiquée pour ce disque de 100 Go, vous devez écrire 123 Go sur ce disque par jour. C'est peut-être trop peu pour vous, c'est pourquoi il existe des entraînements encore plus endurants sur le marché. Stec, fournisseur OEM de certains fournisseurs de premier plan, a répertorié les disques pour «10x écritures complètes sur disque pendant 5 ans». Ce sont tous des appareils eMLC.

Oui, R5 entraîne une amplification d'écriture. Cependant, cela n'a pas d'importance dans la plupart des cas d'utilisation.


Il y a aussi un autre problème ici. Les disques SSD peuvent effectuer des écritures (et des lectures) si rapidement que le goulot d'étranglement d'E / S se déplace vers le contrôleur RAID. C'était déjà le cas avec les disques métalliques en rotation, mais cela est mis en lumière lorsque les SSD sont impliqués. Le calcul de la parité est coûteux et vous aurez du mal à obtenir vos performances d'E / S à partir d'un LUN R5 créé avec des SSD.

sysadmin1138
la source
Que sont les SLC, MLC, HE-MLC et eMLC?
mdpc
1
Merci pour l'exemple et le raisonnement. Logique. Mon patron me dit de ne jamais utiliser RAID5 avec SSD, mais plutôt RAID0, RAID1 ou RAID10. Ne comprenez pas assez pour débattre correctement.
Damainman
1
@Damainman La principale raison de ne pas utiliser R5 avec SSD est que vous laissez beaucoup de performances sur le plancher lorsque vous faites cela. Ce n'est pas parce que les choses s'usent plus vite (plus).
sysadmin1138
1
N'utilisez pas non plus RAID0 si vous vous souciez de vos données. Les SSD n'échouent pas aussi souvent que la rouille, mais ils échouent. Le mode de défaillance le plus courant dans les SSD que j'ai vu est la défaillance complète du contrôleur sous une forme ou une autre, ce qui signifie une perte totale - votre RAID0 est maintenant cassé.
Daniel Lawson
2
Si vous vous souciez de vos données, sauvegardez-les. Le RAID n'est là que pour que tout fonctionne pendant une panne de disque.
John Hunt du
9

J'ai trouvé 2 articles de recherche sur ce sujet:

  1. La mise à jour de parité augmente la charge de travail d'écriture et l'utilisation de l'espace

    introduction

    [...] Les résultats de notre modèle analytique montrent que RAID5 est moins fiable que le striping avec un petit nombre de périphériques à cause de l'ampli fi cation d'écriture.

    Conclusion

    [...] Différents facteurs tels que le nombre d'appareils et la quantité de données sont explorés, et les résultats impliquent que RAID5 n'est pas universellement bénéfique pour améliorer la fiabilité des systèmes SSD

    Source: Ne laissez pas le RAID attaquer la durée de vie de votre baie SSD
    (Publié le 02/2012)

  2. Le vieillissement égal de tous les SSD impose un risque de défaillance simultanée (RAID1 et RAID6 également affectés!)

    Abstrait

    [...] Des solutions de redondance telles que RAID peuvent potentiellement être utilisées pour se protéger contre le taux d'erreur binaire élevé (BER) des disques SSD vieillissants. Malheureusement, de telles solutions usent des dispositifs redondants à des taux similaires, induisant des défaillances corrélées à mesure que les baies vieillissent à l'unisson. [...]

    5. Résultats de simulation

    [...] Le RAID-5 conventionnel fait vieillir tous les SSD en mode verrouillage, et le RAID-4 conventionnel le fait avec les périphériques de données; en conséquence, la probabilité de perte de données en cas de défaillance d'un SSD grimpe à presque 1 pour les deux solutions à mesure que la baie vieillit et se réinitialise périodiquement à presque zéro chaque fois que tous les SSD sont remplacés simultanément. [...]

    Source: Différentiel RAID: repenser le RAID pour la fiabilité des SSD
    (Publié le 03/2012)

    Pour se protéger de cela, le document propose un nouveau niveau RAID appelé Diff-RAID qui effectue automatiquement le brassage en fonction de l'âge sur les remplacements de périphériques).

    Vous pouvez vous protéger contre cela en vérifiant manuellement l'indicateur d'usure du SSD et en remplaçant les lecteurs de manière proactive par des disques de rechange afin qu'à aucun moment plusieurs disques n'aient le même âge critique.

TegtmeierDE
la source
1
Sensationnel. C'est une boîte de vers.
Patrick
7

Le RAID parité va détruire votre SSD SATA de bureau de 300 $. Il ne mettra même pas un brin dans un SSD de 3000 $ de qualité entreprise.

Tout dépend de ce que vous achetez et de votre cas d'utilisation. Le SSD est une technologie beaucoup plus mature qu'auparavant. Sur le haut de gamme, leurs écritures MTBF et max approchent du même type de fiabilité que les disques durs mécaniques.

L'une des raisons pour lesquelles vous ne souhaiterez peut-être pas utiliser le RAID à parité sur SSD est que vous pouvez rapidement saturer un fond de panier ou un bus de contrôleur avec un grand groupe RAID SSD à plusieurs membres. Les rendements diminuent très rapidement avec la vitesse de lecture des SSD haut de gamme et la bande passante bus / fond de panier des contrôleurs RAID actuels. Sans oublier que s'il s'agit de données hébergées sur le réseau, il est tout à fait possible que vos interfaces réseau soient le goulot d'étranglement avant les E / S sur disque lorsque vous parlez de grands RAID SSD.

Au fond, la vie d'écriture n'est pas un gros problème à moins que vous construisez votre « serveur » de Newegg, mais il y a d'autres raisons pour lesquelles vous pouvez être gaspiller de l' argent en mettant les disques SSD dans de grands ensembles RAID de parité.

MDMarra
la source
3
Il est assez facile de détecter les goulots d'étranglement de débit séquentiel brut lors de l'utilisation de disques SSD, même sur les contrôleurs RAID de dernière génération. Cependant, il est beaucoup plus difficile de rencontrer des goulots d'étranglement d'E / S aléatoires. Même si vous n'êtes pas en mesure de saturer tous vos SSD séquentiellement, vous obtiendrez toujours des performances accrues dans des charges de travail aléatoires.
Daniel Lawson
1
@MDMarra merci pour la réponse, j'ai fait un vote positif sur votre réponse en raison des détails fournis :).
Damainman