Quel est l'état actuel (2016) des disques SSD en RAID?

51

Il existe de nombreuses ressources disponibles en ligne qui traitent de l'utilisation des disques SSD dans les configurations RAID. Celles-ci remontent pour la plupart à quelques années et l'écosystème des disques SSD évolue très rapidement. Nous attendons la sortie du produit "Optane" d'Intel plus tard cette année. qui va tout changer ... encore.

Je commencerai par ma question en affirmant qu'il existe une différence qualitative entre les SSD grand public (par exemple, Intel 535) et les SSD de niveau centre de données (par exemple, Intel DC S3700).

Ma principale préoccupation concerne la TRIMprise en charge dans les scénarios RAID. À ma connaissance, bien que plus de six ans se soient écoulés depuis l’introduction des SSD dans les ordinateurs grand public et quatre ans depuis que NVMe était disponible dans le commerce, les contrôleurs RAID modernes ne prennent toujours pas en charge l’envoi de TRIMcommandes aux SSD connectés, à l’exception des contrôleurs RAID d’Intel. en mode RAID-0.

Je suis surpris que le TRIMsupport ne soit pas présent en mode RAID-1, étant donné la façon dont les disques se reflètent, cela semble simple. Mais je m'égare.

Je remarque que si vous souhaitez une tolérance de panne avec les disques (disque dur et SSD), vous les utiliserez dans une configuration RAID - mais comme les disques SSD seraient sans TRIM, cela signifierait qu'ils subiraient une amplification en écriture qui entraînerait une usure supplémentaire. à son tour, les disques SSD échoueraient prématurément. C’est une ironie malheureuse: un système conçu pour protéger contre les pannes de disque peut en résulter directement.

Alors:

  1. Un TRIMsupport est-il nécessaire pour les SSD modernes (de l’ère 2015-2016)?

    1.1. Existe-t-il une différence entre le besoin de TRIMsupport entre les disques SSD SATA, SATA-Express et NVMe?

  2. Il est souvent annoncé que les lecteurs ont un système intégré de collecte des ordures; cela évite- TRIMt-il la nécessité ? Comment fonctionne leur processus de GC dans les environnements RAID?

    1.1. Par exemple, consultez le présent AQ de 2010 décrivant la dégradation des performances due à la non-TRIMming ( https://superuser.com/questions/188985/how-badly-do-ssds-degrade-without-trim ) - et cela Un article de 2015 montre que l'utilisation de TRIM est fortement recommandée ( http://arstechnica.com/gadgets/2015/04/ask-ars-my-ssd-does-garbage-collection-so-i-dont-need-trim -right / ). Quelle est votre réponse à ces arguments solides en faveur de la nécessité de TRIM?

  3. De nombreux articles et discussions des années précédentes concernent le SLC contre le flash MLC et que le SLC est préférable, en raison de sa durée de vie beaucoup plus longue. Cependant, il semble que tous les disques SSD actuels (quel que soit leur emplacement sur le spectre Grand Public / Entreprise) sont du type MLC thesedays - cette distinction est-elle plus pertinente?

    1.1 Et qu'en est-il de TLC Flash?

  4. Les disques SSD d’entreprise ont généralement des limites d’endurance / d'écriture beaucoup plus élevées (souvent exprimées en nombre de fois que vous pouvez écraser complètement le disque en une journée, tout au long de sa durée de vie prévue de 5 ans) - si leur limite de cycle d'écriture est très élevée (par exemple: Cela signifie-t-il qu'ils n'en ont pas besoin TRIMdu tout parce que ces limites sont si élevées ou, au contraire, ces limites ne sont-elles accessibles qu'en utilisant TRIM?

Dai
la source
6
Bien que je ne puisse pas répondre à votre question, je pense que cela devrait être considéré à la lumière du fait que notre industrie essaie de supprimer le RAID propriétaire, les fournisseurs de cloud public utilisent tous les disques SSD sur des services de calcul et de stockage, ce qui a certainement résolu le problème. avec les logiciels, le codage d'effacement, etc. Les innovations en matière d'informatique en nuage ont exposé des éléments tels que le RAID matériel, Cisco IOS et les réseaux de stockage exclusifs en tant que produits inutiles qui fermentent au sommet de la chaîne alimentaire et entravent l'innovation. Le RAID matériel ne peut pas être vendu à l'échelle (à AWS, Azure, CERN), alors ...
Sum1sAdmin
@ Sum1sAdmin, les fournisseurs de cloud public utilisent tous les disques SSD maintenant sur les services de calcul et de stockage Voulez-vous dire qu'AWS ou BlackBlaze stockent des données uniquement sur des disques SSD?
AL
@ AL bien non, je signale seulement que l'offre SSD pour le stockage de blocs, de fichiers, d'objets et éphémères
Sum1sAdmin
Je suis complètement en désaccord avec la "différence qualitative" entre commercial et consommateur. Je peux vous assurer qu'il n'y a aucune différence dans la fabrication de NAND. Il existe certes différents fabricants (Samsung vs Intel), mais ils ne disposent pas non plus d'un processus de fabrication particulier pour le consommateur. Il existe certes des différences de fonctionnalités, mais pas de différences de qualité.
Jim B
En parlant d'Optane, nous sommes presque à mi-chemin de 2016 et ce n'est nulle part en vue ... Quelqu'un sait quel est le contrat?
Jeff Meden

Réponses:

24

Essayons de répondre une question à la fois:

  • Le support TRIM est-il nécessaire pour les SSD modernes (de l’ère 2015-2016)?

Réponse courte: dans la plupart des cas, non. Réponse longue: si vous réservez un espace disponible suffisant (environ 20%), même les disques grand public ont généralement de bonnes valeurs de cohérence des performances (mais vous devez éviter les disques qui, au contraire, risquent de s'étrangler lors d'écritures prolongées). Les disques d'entreprise sont encore meilleurs, à la fois parce qu'ils disposent par défaut d'un espace disponible plus important et que leur combo contrôleur / micrologiciel est optimisée pour une utilisation continue du disque. Par exemple, jetez un coup d'œil au lecteur S3700 que vous avez référencé: même sans ajustement, il présente une très bonne cohérence en écriture.

  • Souvent, les disques sont annoncés comme ayant une fonction de récupération de la mémoire intégrée améliorée. Cela évite-t-il le besoin de TRIM? Comment fonctionne leur processus de GC dans les environnements RAID

Le lecteur de mémoire de lecteur fait sa magie à l'intérieur du bac à sable de lecteur - il ne sait rien de l'environnement extérieur. Cela signifie qu’il n’est (généralement) pas affecté par le niveau RAID de la matrice. Cela dit, certains niveaux de RAID (celui basé sur la parité, en gros) peuvent parfois (et dans certaines implémentations spécifiques) augmenter le facteur d'amplification en écriture, ce qui signifie donc un travail plus important pour les routines du GC.

  • Beaucoup d'articles et de discussions des années précédentes concernent le SLC contre le flash MLC et que le SLC est préférable, en raison de sa durée de vie beaucoup plus longue. Cependant, il semble que tous les disques SSD (quel que soit leur emplacement sur le spectre grand public / grand public) sont des mémoires MLC. - Cette distinction est-elle plus pertinente?

Les disques durs SLC ont pratiquement disparu de l'entreprise, étant principalement relégués à des tâches militaires et à des tâches industrielles. L'entreprise marquée est maintenant divisée en trois catégories:

  • Le flash HMLC / MLCe est celui qui possède les meilleures puces MLC regroupées et qui est certifié pour supporter au moins 25 000/30000 cycles de réécriture;
  • Les puces MLC 3D sont évaluées à environ 5000-10000 cycles de réécriture;
  • Les puces planaires normales MLC et 3D TLC sont évaluées à environ 3000 cycles de réécriture.

En réalité, n'importe lequel des types de flash ci-dessus devrait vous fournir une grande capacité d'écriture et, en fait, vous pouvez trouver des disques d'entreprise avec tous les types de flash ci-dessus.

La véritable différenciation entre les lecteurs d'entreprise et les lecteurs grand public est la suivante:

  • la combinaison contrôleur / microprogramme, avec les disques d'entreprise beaucoup plus difficile à mourir en raison d'un bogue inattendu du contrôleur;
  • le cache en écriture protégé contre l'alimentation, extrêmement important pour empêcher la corruption du FTL (Flash Translation Layer), qui est stocké sur la mémoire flash elle-même.

Les pilotes de classe entreprise sont mieux en raison de leurs contrôleurs et de leurs condensateurs de puissance plutôt que de leur meilleur flash.

  • Les disques SSD d’entreprise ont généralement des limites d’endurance / d’écriture beaucoup plus élevées (souvent exprimées en nombre de fois que vous pouvez écraser complètement le disque en une journée, tout au long de sa durée de vie prévue de 5 ans), évite-t-il toute ne pas exécuter TRIM?

Comme indiqué ci-dessus, les disques de niveau entreprise disposent d'un espace disponible par défaut beaucoup plus important (environ 20%), ce qui réduit considérablement le besoin de TRIM standard.

Quoi qu'il en soit, veuillez noter que certains RAID logiciels prenant en charge les TRIM (quelqu'un a dit Linux MDRAID? )

Shodanshok
la source
Seulement 35 000 cycles d'écriture?! Cela ne semble pas être beaucoup. Je suppose que cela a du sens si les remplacements de disques augmentés sont moins chers que d’acheter la même capacité dans SLC.
user253751
~ 30000 cycles de réécriture garantis minimum ne sont pas mauvais: avec la capacité accrue apportée par le passage à NAND 2 bits par cellule, les disques MLC sont beaucoup moins chers que ceux SLC tout en conservant une endurance similaire. De plus, l'époque où les cellules SLC de classe 50 nm étaient évaluées à plus de 100 000 cycles de réécriture est probablement révolue: même les disques d'entreprise possèdent une mémoire flash de classe 34 / 25nm (ou inférieure), avec une endurance intrinsèque plus faible (qui affecte également les disques SLC).
Shodanshok
@shodanshok Votre conclusion est la suivante: "Utilisez des disques SSD de classe entreprise (SAS) connectés à un contrôleur RAID normal et ne vous inquiétez pas pour cela" - et que je ne vois pas de baisse de performances dans les 5 années pour lesquelles un disque est garanti? Et que les problèmes de performances documentés par d'autres utilisateurs n'affectent que les lecteurs grand public?
Dai
@Dai pour les disques "de niveau entreprise" Je ne parle pas uniquement des disques SSD SAS, mais également de certains disques SSD SATA pouvant être considérés comme des "disques d'entreprise". Et oui, les disques d'entreprise ont une très bonne cohérence des performances, même à l'état stable (c.-à-d. Complètement plein). Pour un exemple de tels lecteurs, voir ici . Même certains comportements de consommation, associés à une surproduction généreuse, peuvent être relativement cohérents. Voir ici pour un exemple.
Shodanshok
1
Le binning est le processus par lequel les puces de silicium sont examinées et regroupées en fonction de leur qualité. Les puces NAND MLC d’entreprise sont donc à la base des puces "mieux fabriquées" et mieux testées.
Shodanshok
9

TRIM ne me préoccupe jamais lorsque j'utilise des disques SSD sur des contrôleurs RAID modernes. Les disques SSD ont été améliorés, les fonctions du contrôleur RAID matériel ont été optimisées pour ces charges de travail et les rapports d’endurance sont généralement en place.

TRIM est destiné aux disques SATA d'extrémité inférieure. Pour les disques SSD SAS, nous avons unmap SCSI, et c’est peut-être la raison pour laquelle je ne réponds pas aux besoins en TRIM ...

Mais l'autre commentateur est correct. Le stockage défini par logiciel (SDS) modifie la façon dont nous utilisons les disques SSD. Dans les solutions SDS, les contrôleurs RAID ne sont pas pertinents. Et des choses comme TRIM ont tendance à être moins importantes car les disques SSD remplissent des rôles spécifiques. Je pense au cache de lecture du stockage Nimble ou aux ZFS L2ARC et ZIL ... Ils répondent tous à des besoins spécifiques et le logiciel exploite les ressources plus intelligemment.

ewwhite
la source
3
UNMAP et TRIM font exactement la même chose.
Michael Hampton
2
Un découpage / unmap est toujours requis - sans cela, vous auriez à compter entièrement sur le ramassage des ordures interne
Jim B
Le ramassage des ordures interne ne remplace pas TRIM. Aucune fonction de micrologiciel ne peut remplacer ce que fait TRIM. C'est un peu alarmant, tant de réponses ne comprennent pas ce que TRIM fait réellement et pourquoi il est nécessaire. Reportez-vous à des articles tels que celui-ci arstechnica.com/gadgets/2015/04/…
Shiv
1

Niveaux RAID avec SSD Une réponse ci-dessus suggère que les niveaux RAID avec parité, comme RAID 5, augmentent l'amplification en écriture. Il y a vraiment plus d'une façon d'interpréter cela: l'impact sur un lecteur ou l'impact sur l'ensemble des lecteurs.

Par rapport à l'absence de redondance, RAID 5 ajoute des écritures à l'ensemble car il ajoute une parité de contrôle. Comparé à un groupe RAID 0 de (n-1) lecteurs, l'impact d'un lecteur RAID 5 à n lecteurs sur chaque lecteur est nul. Chacun des n lecteurs reçoit autant d'écritures. RAID 5 ajoute 1 / (n-1) écriture supplémentaire à l'ensemble. RAID 1 et RAID 10 ajoutent toutefois 100% d'écritures supplémentaires à l'ensemble, car tout ce qui est écrit sur un SSD est écrit sur son miroir.

Ainsi, en termes d'écriture sur un ensemble RAID 5 par rapport à un ensemble RAID 10 avec le même nombre de disques, les disques SSD de l'ensemble RAID 5 recevront moins d'écritures. Et cela reste vrai même si vous augmentez le nombre de disques SSD dans le jeu RAID 10 pour égaliser la capacité utilisable.

Keith J
la source
0

Shodanshok a évoqué la vraie réponse ici. Si vous réservez de l'espace supplémentaire, "sur-provision", l'endurance et la cohérence des performances en écriture de votre SSD seront toutes deux améliorées avec le temps, et le manque de prise en charge TRIM devient pratiquement inutile. Réserver cet espace supplémentaire peut être effectué aussi simplement que, à partir d'un nouveau disque SSD, un partitionnement inférieur à la capacité totale. La plupart des contrôleurs intégrés au lecteur traitent les espaces jamais utilisés de la même manière que les espaces réservés et réduisent ainsi considérablement l’amplification en écriture. Pour le démarrage et le système d'exploitation, 10% d'espace réservé est probablement suffisant. Pour les lecteurs ré-écrits souvent, augmentez cet espace.

Keith J
la source