Les disques SSD sont-ils aussi fiables que les disques mécaniques (2013)?

162

Les disques SSD existent depuis plusieurs années. Mais la question de la fiabilité se pose toujours.

Je suppose que cela fait suite à cette question postée il y a 4 ans et mise à jour en 2011. Elle est maintenant 2013, a beaucoup changé? Je suppose que je recherche des preuves réelles, plus qu’un simple instinct. Peut-être que vous les utilisez dans votre DC. Quelle a été votre expérience?

Fiabilité des disques SSD


MISE À JOUR:

Nous sommes en 2016. Je pense que la réponse est probablement oui (dommage qu'ils coûtent quand même plus cher par Go).

Ce rapport donne quelques preuves:

Fiabilité Flash en production: l'attente et l'inattendue

Et quelques données intéressantes sur les entraînements mécaniques (grand public):

Backblaze: Données et statistiques du disque dur

Mat
la source
2
Pourquoi dites-vous que le problème de fiabilité est toujours soulevé?
ewwhite
6
Le disque dur SSD de ma femme cesse de fonctionner tous les deux ou trois mois et nécessite une correction étrange du type "sous tension, mais n'essayez pas de démarrer pendant vingt minutes". Ensuite, c'est bon encore. Nouvelle technologie, nouvelles façons d’échouer.
Jaydee
3
Je crains fort que je n’aie obtenu qu’un seul point de données: j’ai eu un MacBook Retina Pro en septembre dernier et une défaillance du terminal SSD dans les 60 jours. L'unité de remplacement a fonctionné, mais je m'en méfie maintenant simplement parce que le remplacement / la mise à niveau de l'utilisateur n'est vraiment pas une option.
Roddy
27
De toute façon, vous ne voulez pas d'un lecteur fiable. S'il échoue tous les jours à 14 heures, vous pourrez vous en servir pour régler votre montre. Ce que vous voulez, c'est un lecteur résistant.
Alan B
3
Les disques SSD existent depuis beaucoup plus longtemps que «plusieurs années maintenant». Plus comme 40, en fait, et même si vous parlez de SSD basés sur Flash, nous parlons presque de 20 ans.
Alastair

Réponses:

175

Cela va être fonction de votre charge de travail et de la classe de lecteur que vous achetez ...

Dans mes déploiements de serveurs, je n'ai pas eu d'échec d'un SSD correctement spécifié. Cela concerne de nombreux types de lecteurs, d'applications et de charges de travail.

Rappelez-vous, tous les SSD ne sont pas identiques !!

Alors, que veut dire "correctement spécifié" ?

Si votre question concerne l'utilisation de disques SSD dans des applications d'entreprise et de serveur, un certain nombre de changements ont été apportés ces dernières années depuis la question initiale . Voici quelques points à considérer:

  • Identifiez votre cas d'utilisation: il existe des lecteurs grand public, des lecteurs d'entreprise et même des SSD durcis pour applications industrielles . N'achetez pas de disque bon marché destiné à être utilisé sur un ordinateur de bureau et utilisez une base de données exigeante en écriture.

  • De nombreux facteurs de forme sont disponibles: Les disques SSD actuels se trouvent dans les cartes PCIe, SATA et SAS 1.8 ", 2.5", 3.5 "et autres variantes.

  • Utilisez RAID pour vos serveurs: vous ne dépendriez pas d'un seul disque mécanique dans une situation de serveur. Pourquoi voudriez-vous faire la même chose pour un SSD?

  • Composition du lecteur: Il existe des disques SSD à base de DRAM, ainsi que les types de flash MLC, eMLC et SLC. Ces derniers ont une durée de vie limitée, mais ils sont bien définis par le fabricant. Par exemple, vous verrez des limites d'écriture quotidiennes telles que 5 To / jour pendant 3 ans .

  • Les applications sont importantes: certains lecteurs sont destinés à un usage général, tandis que d'autres sont optimisés en lecture ou en écriture. Les lecteurs basés sur DRAM tels que sTec ZeusRAM et DDRDrive ne s'usent pas. Celles-ci sont idéales pour les environnements à écriture élevée et pour les disques plus lents. Les lecteurs MLC ont tendance à être plus grands et optimisés pour les lectures. La durée de vie des disques SLC est supérieure à celle des disques MLC, mais le MLC d'entreprise semble être suffisant pour la plupart des scénarios.

  • TRIM ne semble pas avoir d'importance: les contrôleurs RAID matériels ne semblent toujours pas le supporter complètement . Et la plupart du temps, j'utilise des disques SSD, ce sera sur une configuration RAID matérielle. Ce n'est pas quelque chose qui m'inquiète dans mes installations. Peut-être que je devrais?

  • Endurance: le surapprovisionnement est courant dans les SSD de classe serveur. Parfois, cela peut être fait au niveau du microprogramme ou simplement en partitionnant le lecteur de la bonne manière. Les algorithmes de nivellement d'usure sont également meilleurs à tous les niveaux. Certains disques rapportent même des statistiques de durée de vie et d'endurance. Par exemple, certains disques SSD d'entreprise Sandisk de marque HP apparaissent 98% life remainingaprès deux ans d'utilisation.

  • Les prix ont considérablement baissé: les disques SSD atteignent le bon rapport prix / performances pour de nombreuses applications. Lorsque les performances sont vraiment nécessaires, il est rare de passer aux commandes mécaniques maintenant.

  • Les réputations ont été consolidées: par exemple, Intel est sûr mais pas très performant. OCZ n'est pas fiable. Les disques basés sur Sandforce sont bons. sTec / STEC est extrêmement solide et constitue le fabricant OEM de nombreux lecteurs RAID haut de gamme. Sandisk / Pliant est similaire. OWC propose d'excellentes solutions SSD avec une garantie exceptionnelle pour les serveurs à faible impact et pour le déploiement de stations de travail / ordinateurs portables.

  • La protection contre les coupures de courant est importante: examinez les disques dotés de supercondensateurs / supercaps pour gérer les écritures exceptionnelles lors d'événements d'alimentation. Certains disques améliorent les performances avec des caches intégrés ou les exploitent pour réduire l'usure. Les supercaps garantissent que ces écritures sont vidées dans un stockage stable.

  • Solutions hybrides: les fournisseurs de contrôleurs RAID matériels offrent la possibilité d'étendre les baies de disques standard avec des disques SSD pour accélérer les lectures / écritures ou servir de cache intelligent. LSI possède CacheCade et ses offres matérielle / logicielle Nytro . Des solutions logicielles et au niveau du système d'exploitation existent également pour fournir des fonctions telles que la mise en cache locale sur des systèmes d'application, de base de données ou d'hyperviseur. Les systèmes de fichiers avancés tels que ZFS utilisent de manière très intelligente les disques SSD optimisés en lecture et en écriture; ZFS peut être configuré pour utiliser des périphériques distincts pour la mise en cache secondaire et pour le journal d'intention. Les disques SSD sont souvent utilisés dans cette capacité, même pour les pools de disques durs.

  • La solution flash de premier plan est arrivée: les solutions flash PCIe telles que FusionIO ont mûri au point où les entreprises sont à l'aise pour déployer des applications critiques qui reposent sur des performances accrues. Les solutions d'appareils et de SAN, telles que RanSan et Violin Memory, existent toujours, avec davantage d'entrants entrant dans cet espace.

entrez la description de l'image ici

ewwhite
la source
12
TRIM est vraiment important dans les lecteurs avec très peu de surapprovisionnement, ce qui est le cas dans les lecteurs grand public où le $ / Go est primordial. La plupart des disques d'entreprise ont un surapprovisionnement suffisant pour que TRIM ne fasse aucune différence.
M. Alpha
2
@MisterSmith Voir ce que j'ai écrit ci-dessus. Différents SSD ont des caractéristiques différentes. Utilisez le bon outil pour le travail. Si je prenais un disque Corsair ou un autre lecteur grand public et l'utilisais comme disque SSD pour un système de base de données très actif en écriture ou comme périphérique de journal ZIL pour une baie de stockage ZFS, je le graverais dans un mois ou deux. .
ewwhite
1
Excellent post. Une bête noire: les contrôleurs RAID ne sont pas toujours le bon choix avec les SSD. Les contrôleurs RAID ont été conçus pour répartir les données et ajouter des codes de correction d'erreur sur plusieurs disques magnétiques. Les contrôleurs SSD segmentent déjà les données de manière native et ajoutent des codes de correction d'erreur sur plusieurs banques de NVRAM. De plus, l'ajout d'un contrôleur RAID introduit un SPOF supplémentaire, le contrôleur RAID lui-même. L' utilisation d' un contrôleur RAID séparé est souvent le bon choix, mais parfois en utilisant un meilleur SSD (grade supérieur SATA / SAS ou même des cartes PCI-E comme Fusion-IO) est un meilleur choix.
Jesper Mortensen
5
@rickyduck, dans un centre de données, une seule panne d'un disque est protégée par RAID, ce qui signifie qu'il faut dépenser quelques dollars pour la remplacer sans temps d'arrêt; tandis que dans une console de jeu, une défaillance du lecteur unique est une perte totale de données et une réinstallation du système d'exploitation.
2
@MisterSmith, même les disques SSD de bureau haut de gamme sont moins chers par Go que ceux destinés à des utilisations typiques de centres de données. Outre des contrôleurs plus puissants dans certains cas (ou simplement un micrologiciel à faible volume réglé pour un débit plutôt que des performances en rafale), ils tirent le meilleur parti de la production car la plupart des charges de travail sur serveur sont beaucoup plus intensives en IO que de bureau. conduit et tuerait rapidement un lecteur consommateur.
Dan Neely
59

Chaque ordinateur portable de mon travail utilise un disque SSD ou hybride depuis 2009. Mon expérience du disque SSD en résumé:

  • Ce que j'appellerai les disques de "1ère génération", vendus vers 2009 principalement:
    • Au cours de la première année, environ 1/4 sont morts, presque tous du syndrome de la mort subite (SSD - C'est drôle, rire). Cela était très perceptible pour les utilisateurs finaux et agaçant, mais la différence de vitesse drastique rendait ce schéma de pannes constant tolérable.
    • Au bout de 3 ans, tous les lecteurs sont morts (mort subite ou usure), à ​​l'exception de deux qui sont encore en train de botter (actuellement des lecteurs L2Arc sur un serveur).
  • Les disques "2nd Gen", vendus vers 2010-11, se distinguent de la génération précédente car leur taux de syndrome de mort subite a chuté de façon spectaculaire. Cependant, le "problème" d'usure persiste.
    • Après la première année, la plupart des lecteurs fonctionnaient encore. Il y avait un couple de morts subites. Un couple a échoué à cause de l'usure.
    • Après 2-3 ans, plus de la moitié travaillent encore. Le taux d'échec de la première année s'est essentiellement poursuivi.
  • Les lecteurs de "3ème génération", vendus à partir de 2012, fonctionnent toujours.
    • Après la première année tout fonctionne toujours (cogner sur du bois).
    • Le disque le plus ancien que je connaisse date de mars 2012, donc pas encore de données sur 2-3 ans.

SSD Failure (Cumulative)


Mise à jour de mai 2014:
Quelques-uns des disques de "2e génération" ont échoué depuis, mais environ un tiers des disques d'origine fonctionnent toujours. Tous les lecteurs de "3ème génération" du graphique ci-dessus fonctionnent toujours (cogner au bois). J'ai entendu des histoires similaires d'autres, mais ils portent toujours le même avertissement concernant la mort sur des ailes rapides . Le vigilant gardera ses données bien sauvegardées.

Chris S
la source
2
Mon expérience fait écho à cela. Cela dit, nous fournissons toujours des disques durs USB que les employés peuvent utiliser comme sauvegardes de machine à remonter le temps (en plus de notre schéma de sauvegarde standard hors site), afin de permettre des restaurations rapides et granulaires en cas de panne ou de perte catastrophique.
EEAA
22
Donnez à la 3ème génération un autre an ou deux. ;)
Andy
7
Il convient également de noter que les disques SSD sont beaucoup plus susceptibles de souffrir de bogues du micrologiciel que les disques durs; le firmware est à la fois plus compliqué et moins mature, ce qui n’est pas une bonne combinaison.
Alastair
2
@ Andy a raison. À partir de 2009, vous dites que la demi-vie était d'environ un an. Pour la période allant de 2010 à 2011, nous avons à peine 3 ans pour le milieu de cette fourchette, pour laquelle vous indiquez une demi-vie de 3 ans. Cela ne pourrait être basé que sur les observations actuelles. On ne sait pas vraiment si la demi-vie des disques 2012 et 2013 est supérieure à 3 ans au moins jusqu'en 2016. (Nous pourrions essayer d'extrapoler à partir de défaillances précoces, mais il s'agirait probablement de défauts de fabrication isolés, qui ne seraient pas causés par de longues pertes. -utilisation régulière à long terme.)
Andrew Vit
1
J'utilise 2 x Intel X25M 80 Go G1 depuis 2010. Mon travail implique des processus de lecture / écriture très lourds. Tous les quelques mois ou plus, je réinitialise le lecteur (ce n'est pas nécessaire) pour rétablir les performances, mais sinon, aucun problème. J'ai ajouté un 256 Go Samsung 230 l'année dernière. Aucun problème jusqu'à présent!
Antillar Maximus
18

D'après mon expérience, le vrai problème concerne les contrôleurs en train de mourir, pas la mémoire flash elle-même. J'ai installé environ 10 SSD Samsung (830, 840 [not pro]) et aucun d'entre eux n'a posé de problème jusqu'à présent. En revanche, les lecteurs équipés de contrôleurs Sandforce ont rencontré plusieurs problèmes, notamment le gel des lecteurs d’agilité OCZ, en particulier des blocages irréguliers, où le lecteur cesse de fonctionner jusqu’à ce que j’arrête l’ordinateur. Je peux vous donner deux conseils:

  1. Si vous avez besoin d’une grande fiabilité, choisissez un lecteur avec MLC, un meilleur flash SLC. Samsung 840 fe a flash TLC, et une courte garantie, je pense pas sans raison;)

  2. Choisissez un lecteur avec un contrôleur réputé stable.

klingt.net
la source
Cela me rappelle les contrôleurs mourants sur l’éclairage LED actuel. Les LED durent très longtemps, mais les contrôleurs ne semblent pas.
Matt
1
Qui sait, mais peut-être que cela fait partie de l'obsolescence programmée des industries :)
klingt.net
11

www.hardware.fr L’ un des plus grands sites français d’informations sur le matériel est partenaire de www.ldlc.com, l’ un des plus gros revendeurs en ligne français. Ils ont accès à leurs statistiques de retour et publient des rapports de taux d'échec (cartes mères, blocs d'alimentation, RAM, cartes graphiques, disque dur, SSD, ...) deux fois par an depuis 2009.

Ce sont des statistiques de "décès prématuré", de 6 mois à 1 an d'utilisation. De plus, les retours directs au fabricant ne peuvent pas être comptés, mais la plupart des gens reviennent au revendeur au cours de la première année et cela ne devrait pas affecter les comparaisons entre marques et modèles.

En règle générale, les taux d'échec des disques durs présentent moins de variations entre les marques et les modèles. La règle est plus grande capacité> plus de plateaux> taux d'échec plus élevé, mais rien de dramatique.

Le taux d'échec des disques SSD est globalement inférieur, mais certains modèles de disques SSD étaient vraiment mauvais, avec environ 50% de retours pour les plus infâmes au cours de la période que vous avez demandée (2013). Semble avoir arrêté maintenant que cette marque infâme a été achetée.

Certaines marques de SSD «optimisent» leur microprogramme pour obtenir des résultats légèrement supérieurs en termes de points de repère. Vous rencontrez parfois des blocages, des écrans bleus, ... Cela semble également poser moins de problèmes qu’en 2013.

Les rapports de taux d'échec sont disponibles:
2010
2011 (1)
2011 (2)
2012 (1)
2012 (2)
2013 (1)
2013 (2)
2014 (1)
2014 (2)
2015 (1)
2015 (2)
2016 (1) )
2016 (2)

Sacha K
la source
Voici un lien vers une version traduite automatiquement de l'article français translate.googleusercontent.com/…
SDwarfs