Nous (et j'entends Jeff, je veux dire) étudions la possibilité d'utiliser des disques SSD MLC grand public dans notre centre de données de sauvegarde.
Nous voulons essayer de réduire les coûts et d’augmenter l’espace utilisable - les Intel X25-E coûtent donc environ 700 $ chacun et 64 Go de capacité.
Ce que nous pensons faire, c'est acheter des disques SSD bas de gamme offrant plus de capacité à un prix inférieur. Mon patron ne pense pas que dépenser environ 5 000 $ pour des disques dans des serveurs à court de centre de données de sauvegarde en vaut la peine.
Ces lecteurs seraient utilisés dans une grappe RAID à 6 lecteurs sur un Lenovo RD120. Le contrôleur RAID est un Adaptec 8k (Lenovo renommé).
À quel point cette approche est-elle dangereuse et que peut-on faire pour atténuer ces dangers?
Réponses:
Quelques réflexions;
Bonne chance - il suffit de ne pas les "frire" avec écrit :)
la source
J'ai trouvé ce lien, qui contient une analyse intéressante et approfondie des disques SSD MLC et SLC dans les serveurs.
Notez que certains fournisseurs de disques SSD MLC affirment que leurs disques sont suffisamment "professionnels" pour survivre aux écritures:
Une analyse plus approfondie de ces revendications chez AnandTech .
De plus, Intel a maintenant déclaré publiquement que SLC risquait d’être excessif dans les serveurs 90% du temps :
Même pour ses disques SSD orientés serveur, Intel a migré de SLC vers MLC avec un très grand espace de "surapprovisionnement" avec le nouveau processeur Intel SSD 710 . Ces lecteurs allouent jusqu'à 20% de l'ensemble du stockage à la redondance en interne:
la source
Basez toujours ce genre de choses sur des faits plutôt que sur des suppositions. Dans ce cas, il est facile de collecter des informations: enregistrez des profils IOPS en lecture / écriture à long terme de vos systèmes de production, puis déterminez ce que vous pouvez vivre dans un scénario de reprise après sinistre. Vous devriez utiliser quelque chose comme le 99e centile comme mesure. Ne pas utiliser de moyennes lors de la mesure de la capacité IOPS - les pics importent peu! Ensuite, vous devez acheter la capacité requise et les IOPS nécessaires pour votre site de reprise après sinistre. Les SSD peuvent être le meilleur moyen de le faire, ou peut-être pas.
Ainsi, par exemple, si vos applications de production nécessitent 7 500 IOPS au 99e centile, vous pouvez décider de vivre avec 5 000 IOPS en cas de sinistre. Mais il faut au moins 25 disques 15K requis sur votre site de reprise après sinistre. Par conséquent, les disques SSD pourraient constituer un meilleur choix si vos besoins en capacité sont faibles (cela ressemble à ce qu’ils sont). Mais si vous mesurez seulement 400 400 IOPS en production, achetez 6 disques SATA, économisez de l'argent et utilisez l'espace supplémentaire pour stocker davantage d'instantanés de sauvegarde sur le site de récupération d'urgence. Vous pouvez également séparer les lectures et les écritures de votre collection de données pour déterminer la durée de vie des disques SSD non destinés à l'entreprise pour votre charge de travail en fonction de leurs spécifications.
N'oubliez pas non plus que les systèmes de reprise après sinistre peuvent avoir une mémoire plus petite que la production, ce qui signifie qu'il faut davantage d'IOPS (davantage de permutation et moins de cache de système de fichiers).
la source
Même si le SSD MLS n'a duré qu'un an, dans un an, les remplacements seront beaucoup moins chers. Alors pouvez-vous faire face au remplacement du SSD MLS quand ils sont sortis?
la source
Si nous mettons de côté le problème de quantité d'écriture (ou prouvons que les disques SSD grand public peuvent le gérer), je pense que les disques SSD sont une bonne chose à ajouter aux environnements de niveau entreprise. Vous utiliserez probablement les disques SSD dans une matrice RAID. RAID5 ou RAID6. Et le problème avec ceux-ci est qu’après une panne de disque unique, le tableau devient de plus en plus vulnérable aux pannes. Et le temps pour le reconstruire dépend fortement du volume de la matrice. Un tableau de plusieurs To peut prendre plusieurs jours à reconstruire, tout en étant constamment utilisé. Dans le cas des disques SSD, les baies RAID seront a) inévitablement plus petites b) le temps de reconstruction diminue considérablement.
la source
Un livre blanc sur les différences entre SLC et MLC de SuperTalent parle de l'endurance de MLC et d'un dixième de l'endurance d'un SSD SLC, mais les chances sont que le SSD MLS survivra au matériel dans lequel vous le mettez de toute façon. Je ne suis pas sûr de la fiabilité de ces statistiques / faits de SuperTalent.
En supposant que vous obteniez un niveau d'assistance similaire de la part du fournisseur des disques SSD MLC, le prix plus bas en vaut la peine.
la source
Vous devez simplement calculer la quantité d'écritures quotidiennes que vous avez avec votre configuration actuelle et la comparer à ce que le fabricant garantit que ses disques SSD peuvent durer. Intel semble être le plus honnête à ce sujet - par exemple, jetez un coup d'œil à ses principales feuilles de données de disques SSD: http://www.intel.com/design/flash/nand/mainstream/technicaldocuments.htm
La section 3.5 (3.5.4, en particulier) du document Spécifications indique que votre disque durera au moins 5 ans avec 20 Go d'écritures par jour. Je suppose que cela est calculé en utilisant toute la capacité du disque et en ne laissant aucun espace libre pour les écritures.
La fiche technique concernant l’utilisation des disques SSD classiques dans un environnement d’entreprise est également intéressante.
la source
Il y a quelques années, j'ai déployé quelques disques SLC de 32 Go en tant que mémoire tampon pour une application affreusement mal conçue que nous utilisions.
L’application comportait 90% de petites écritures (<4 k) et fonctionnait de manière constante (24 h sur 24, 7 jours sur 7) à 14 k w / s une fois sur les disques SSD. Ils étaient configurés en RAID 1, tout était rose, la latence était basse!
Cependant, environ un mois après et le premier disque emballé, littéralement en moins de 3 heures, le second disque était également mort. RAID 1 n'est pas un si bon plan après tout :)
Je serais d'accord avec les autres affiches sur une sorte de RAID 6 si rien d'autre ne répartit ces écritures sur davantage de disques.
Maintenant, gardez à l'esprit que c'était il y a quelques années et que ces choses sont beaucoup plus fiables maintenant et que vous n'avez peut-être pas un profil I / O similaire.
L'application a été repensée. Toutefois, nous avons créé un grand disque virtuel, créé des scripts pour reconstruire / sauvegarder le disque virtuel et compenser le manque d'une heure environ de perte de données. /le temps de récupération.
Encore une fois, le cycle de vie de vos données peut être différent.
la source