Comment vérifier la santé d'un disque SSD?

81

Nous savons tous que les disques SSD ont une durée de vie prédéterminée limitée. Donc, la question pour moi est de savoir comment vérifier (Ubuntu) Linux quel est l'état de santé actuel de mon disque SSD? Et peut-être une estimation du temps que cela prendra?

Un outil graphique est préférable, mais un outil en ligne de commande serait également approprié.

J'utilise Xubuntu 12.04 LTS

keiki
la source
1
Pouvez-vous ajouter le résultat de smartctl -i /dev/sdaà votre question?
Mitch
1
@ dschinn1001 Pas exactement, cela ne s'applique qu'aux SSD récents. Les disques SSD de première et deuxième générations ont une durée de vie limitée en fonction du nombre d'écritures sur le disque.
João André
1
Venant de la vieille école, j'ai utilisé des outils de test HD qui écrivaient et lisaient tous les disques plusieurs fois, ce qui prenait quelques heures. Il semble qu'aucun des outils mentionnés n'utilise une telle approche? Une telle approche n’a-t-elle pas un sens pour le SSD? Eh bien, il semble que le disque SSD enregistre ses propres expériences et peut ensuite dire s’il est malade. Ai-je bien compris?
Mads Skjern
@MadsSkjern Il est parfaitement possible d'utiliser un outil tel que badblocks pour vérifier l'état d'un disque SSD. Il y a cependant de très bonnes raisons de NE PAS le faire. D' après mon expérience, les disques SSD échouent généralement après un certain seuil d'écritures. Par conséquent, un test destructif d'écriture en lecture tel que celui qui peut être effectué badblockspeut raccourcir la durée de vie du lecteur.
Geek Elder

Réponses:

35

Installez Gnome Disk Utility et vérifiez que SMART Data et Tests présentent un nombre de niveaux de nivellement ou similaire. Plus ce nombre est élevé (%, de 1 à 100), plus votre SSD est "épuisé", ce qui signifie que vous êtes plus susceptible d'avoir des problèmes. Mais si vous avez un SSD récent, vous n'avez pas à vous en préoccuper.

Installé via

 sudo apt-get install gnome-disk-utility

commencer par

soit menu-> Paramètres-> Utilitaire de disque

ou via la ligne de commande

sudo gnome-disks
João André
la source
2
Oui, je n'étais pas sûr du nom parce qu'ils l'ont changé en 12h10
João André
8
Ubuntu 14.04 ne reconnaît pas palimpsest, bien que gnome-disk-utility soit installé. Je ne vois pas non plus d'utilitaire de disque dans les paramètres (icône d'engrenage). palimpsestest un nom terrible, le nom varie-t-il avec la langue de l'utilisateur (par exemple anglais ou autre)?
Paul
10
comme une note aux lecteurs; palimpset est renommé gnome- discs (comme mentionné, askubuntu.com/a/623306/4580 ).
immeëmosol
2
Pourquoi dites-vous "Si vous avez un SSD récent, vous n'avez pas à vous en soucier"?
JFA
2
Vous avez cela à l'envers. Le nombre d'usure commence à 100 et diminue avec l'utilisation. Par conséquent, plus le nombre est élevé, moins le SSD est utilisé, voir ici: superuser.com/questions/1037644/…
Logix
48

vérifier la santé d'un SSD

Pour les distributions basées sur Ubuntu, Mint ou Debian

# apt-get install smartmontools

Le Media_Wearout_Indicator est ce que vous recherchez. Pour 100 signifie que votre SSD a 100% de points de vie, le nombre inférieur signifie moins de points de vie.

# smartctl -a /dev/sda | grep Media_Wearout_Indicator

Pour montrer vos informations sdd

# smartctl -a /dev/sda

Vous pouvez lire l'article complet sur le blog Nam Huy Linux - Comment vérifier la vie des disques SSD laissés sur Linux

Blanca Higgins
la source
1
Donc, si le mien a une valeur de 199 à 199, est-ce crédible?
m4tm4t
7
Cette propriété n'apparaît pas dans mon SSD. Peut-être que je devrais plutôt regarder Wear_Leveling_Count? comme dans: sudo smartctl -a / dev / sda | grep Wear_Leveling_Count EDIT: confirmé par la réponse ci-dessous: askubuntu.com/a/381779/221115
Jose Gómez
Sur Kingston, vous avezWear_Range_Delta
phreakbox
Dans KINGSTON SV300S37A240G vous devriez rechercherSSD_Life_Left
Herlon Aguiar
Blanca Higgins, namhuy.net/1024/how-to-check-ssd-life-left.html est morte.
mr.zog
35

Si vous ne possédez pas de disque SSD de marque Intel: LISEZ CECI.

Fais attention !! - J'ai été bêtement trompé par 'smartmontools.' J'ai un disque SSD Samsung et l'outil smartmonitor / 'smartctl' a heureusement faussement déclaré que l'attribut '233' (hex 'E9') était 'Media_Wearout_Indicator'; En fait, non, pour Samsung (et les autres fabricants), il en va tout autrement. Cette publication, ainsi que d’autres publications sur le forum, des questions / réponses sur l’échange de piles et les blogs d’experts que j’ai trouvés semblent être «axés sur Intel», avec seulement de vagues indications que «cela peut varier». (Par opposition à toute suggestion selon laquelle vous devez faire attention aux libellés incorrects et erronés de l'attribut par smartmontools).

Alors que je me préparais à copier mon disque SSD sur un nouveau disque dur que j'avais acheté (à cause de ce que smartmontools m'avait dit), j'ai démarré sous Windows (j'ai un système à double démarrage), pour en savoir plus sur les disques SSD à partir de Windows L'outil Samsung 'Samsung_Magician_v43.exe' a dû me parler de mon lecteur. Il était incroyablement peu informatif.

Après des heures de fouilles, j'ai enfin pu exécuter les outils Windows uniquement: hddgaurdian - 'code.google.com/p/hddguardian', puis CrystalDiskInfo: Surprise! Les deux outils me disent indépendamment que mon disque SSD Samsung est «très bien» (le gardien de disque dur dit «5 étoiles» et Crystal Disk «98% OK»). En revanche, l'outil smartctl a explicitement étiqueté l'attribut avec 'decimal-233 /' hex-E9 'comme «indicateur d'usure du support» - et m'a indiqué que sa valeur était «1» ou 1% - un indicateur de (le risque de) en attente d'échec. Pour en être le plus sûr possible, j’ai creusé et j’ai creusé et j’ai finalement pu localiser au moins quelque chose d’officiel de Samsung: " http://www.samsung.com/global/business/semiconductor/minisite/SSD/us/download/ 07_Communiquer_avec_votre_SSD.pdf"Le document implique en effet que l'attribut" hex E9 "/" décimal "233" n'est pas utilisé de la même façon par Samsung. (Samsung: Je suis très déçu, corrigez s'il vous plaît votre outil logiciel officiel, ou du moins, faites-le clair que vous ne fournissez pas d’informations sur l’usure!)

En outre - si vous ne possédez ni SSD Intel ni SSD Samsung - soyez averti, ces informations semblent varier d'un fabricant à l'autre. (Par exemple, consultez le tableau d'étiquettes d'attributs sur "code.google.com/p/hddguardian/wiki/about_reliability" pour la seule indication utile du degré de variabilité que j'ai trouvé.)

Le so-what: Si vous ne possédez pas de disque SSD Intel, ne vous laissez pas induire en erreur par les étiquettes de nom d'attribut fausses fournies par smartmonitor. Peut-être que cela s'améliorera à l'avenir, mais la version installée par défaut pour Ubuntu 12.04 LTS (avril 2014) était un échec total. Au lieu de vous dire «ne sait pas» - smartctl a mal étiqueté l'attribut. Je n'ai pas trouvé d'autre outil pour Linux qui rende les informations "correctes" transparentes ou claires.

Matt S.
la source
1
Accessoires permettant d'inclure le lien vers la documentation Samsung de leurs attributs SMART. Je n'ai aucune idée de ce que sont les autres applications que vous avez mentionnées ou de leur utilité, mais je vous recommande fortement de garder un œil sur l'attribut n ° 5 "Nombre de secteurs réaffectés", ce qui sera un bon indicateur de la proximité de votre disque SSD. à l'échec, comme une fois qu'il est à court de secteurs de réserve qu'il doit utiliser pour remplacer ceux qui vont mal, alors vous approcherez de EOL sur votre SSD
Maks
1
Le fichier PDF est désormais disponible sur le site samsung.com/global/business/semiconductor/minisite/SSD/M2M/…
vigueur
10

Pour les lecteurs Kingston sur des ordinateurs basés sur Debian

Semblable à cette réponse exécuter

# apt-get install smartmontools

Cependant, lorsque j'exécute la commande pour afficher les informations sur le lecteur, il semble que SMART ait été désactivé:

# smartctl -a /dev/sda 
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-45-generic] (local build)
[ ... ]
SMART support is: Available - device has SMART capability.
SMART support is: Disabled

Vous devez l'activer en exécutant ce qui suit en tant que root:

# smartctl -s on -a /dev/sda

Vous pouvez ensuite exécuter un auto-test en effectuant soit un court test (ce qui m'a pris environ 1 minute):

# smartctl -t short -a /dev/sda

ou un test plus approfondi (qui m'a pris environ une heure et demie):

# smartctl -t long -a /dev/sda

Notez que dans la plupart des cas, vous n'avez pas besoin de démonter le lecteur pour exécuter ces tests. Si vous le faites, voyez man smartctl.

Maintenant, lorsque vous exécutez, smartctl -a /dev/sdavous devriez voir un résultat de test d'auto-évaluation. C'est probablement tout ce dont vous avez vraiment besoin pour vous préoccuper:

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Si vous aimez les détails, vous verrez aussi un tableau comme celui-ci:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x0032   095   095   050    Old_age   Always       -       0/178007034
  5 Retired_Block_Count     0x0033   100   100   003    Pre-fail  Always       -       0
  9 Power_On_Hours_and_Msec 0x0032   092   092   000    Old_age   Always       -       7626h+46m+45.580s
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       8
171 Program_Fail_Count      0x000a   100   100   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
174 Unexpect_Power_Loss_Ct  0x0030   000   000   000    Old_age   Offline      -       4
177 Wear_Range_Delta        0x0000   000   000   000    Old_age   Offline      -       1
181 Program_Fail_Count      0x000a   100   100   000    Old_age   Always       -       0
182 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0012   100   100   000    Old_age   Always       -       0
189 Airflow_Temperature_Cel 0x0000   030   035   000    Old_age   Offline      -       30 (Min/Max 24/35)
194 Temperature_Celsius     0x0022   030   035   000    Old_age   Always       -       30 (Min/Max 24/35)
195 ECC_Uncorr_Error_Count  0x001c   120   120   000    Old_age   Offline      -       0/178007034
196 Reallocated_Event_Count 0x0033   100   100   003    Pre-fail  Always       -       0
201 Unc_Soft_Read_Err_Rate  0x001c   120   120   000    Old_age   Offline      -       0/178007034
204 Soft_ECC_Correct_Rate   0x001c   120   120   000    Old_age   Offline      -       0/178007034
230 Life_Curve_Status       0x0013   100   100   000    Pre-fail  Always       -       100
231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0
233 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       3498
234 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       2885
241 Lifetime_Writes_GiB     0x0032   000   000   000    Old_age   Always       -       2885
242 Lifetime_Reads_GiB      0x0032   000   000   000    Old_age   Always       -       868

Si vous recherchez la signification de toutes ces valeurs, consultez la documentation de Kingston .

Mike
la source
Si vous voulez voter par au moins, laissez au moins un commentaire ...
Mike
1
Tous les SSD Kingston ne les prennent pas tous en charge. Certains qui ne le font pas (comme mon UV400 ) semblent afficher des nombres aléatoires dans les champs qu’ils ne prennent pas en charge.
Otus
la réponse manque quelques astuces plus utiles sur les détails intelligents. Juste pour s’assurer que le lecteur lit correctement le tableau de valeurs résultant. En bref, il me semble que la valeur SSD_Life_Left est l'indicateur le plus simple. Si 100, nouvelle SSD, si 1, une SSD morts-vivants.
mh-cbon
@ mh-cbon Comme la réponse est déjà assez verbeuse, j'ai simplement lié à la documentation de Kingston, car il contient BEAUCOUP de détails. Toutefois, si vous pensez pouvoir améliorer la réponse, n'hésitez pas à la modifier.
Mike
5

Wear_Leveling_Count est le bon attribut à suivre. Cependant, comme les autres attributs, 100 est la meilleure valeur et 0 le pire. Voyez cela comme "pourcentage de vie restante".

Jim Van Zandt
la source
3
Cela peut varier d'un fabricant à l'autre, mais c'est très probablement très faux. Sur cette page expliquant les codes micron (alias. Crucial, comme dans "crucial m4", etc.), celle-ci est "Nombre moyen d’effacements de tous les bons blocs". C'est un nombre qui augmentera avec l'utilisation. Si vous lisez un peu sur le nivellement d'usure , vous réaliserez qu'il devrait atteindre au moins des dizaines de milliers de personnes avant la fin de la transmission (c'est-à-dire que vous ne vivrez probablement pas pour le voir mourir de cette façon).
goldilocks
2
Mine dit 1461.
CMCDragonkai
4

La meilleure façon de vérifier l'état d'un disque SSD est de suivre les recommandations du fabricant. Celles-ci variant d’un fabricant à l’autre et pouvant évoluer dans le temps, nous vous conseillons de vérifier auprès du fabricant de vos lecteurs le cas échéant. Selon la classification MTBF (définie par la norme JEDEC JESD218A) fournie par la plupart des fabricants, un disque SSD devrait durer bien plus d’un million d’heures sans problème.

J'ai plusieurs de ces couvrant plusieurs fabricants. Je peux garantir que les attributs SMART varient selon les fabricants. À des fins de comparaison, voici un exemple d' OCZ et des données intelligentes d'une unité Corsair F40, ainsi qu'une discussion sur le manque de fiabilité de ces données.

Bien que les données SMART puissent certainement avoir une valeur, puisque tous les appareils échouent, l’important est que vous sauvegardiez vos données régulièrement. Cela vous assure que vos données sont en sécurité pendant que vous attendez (probablement pendant plusieurs années) la panne de votre disque SSD. À mesure que les coûts diminuent et que les capacités augmentent, il est plus probable que vous remplaciez un disque SSD en raison de contraintes d'espace plutôt que de pannes. (Dans mon expérience, 10 fois plus probable). Je voudrais simplement sauvegarder régulièrement et ne vous inquiétez pas à ce sujet.

Sources:

Expérience, http://www.hardcoreware.net/mtbf-ssd-what-does-it-mean-for-you/

Elder Geek
la source
0

Pour (au moins certains) lecteurs NVMe, vous pouvez faire

smartctl -a /dev/nvme0

Vous pouvez alors chercher une ligne comme celle-ci:

Percentage Used:                    5%

Ici, les nombres plus bas sont meilleurs et 100%signifie que le lecteur est "usé". La documentation du fabricant suggère qu'il est possible d'obtenir des chiffres supérieurs à 100% si vous continuez à utiliser le lecteur au-delà de ce point ( exemple, fourni par Seagate, voir page 12 ).

Notez que si vous utilisez les périphériques d'espace de noms ou de partition, tels que /dev/nvme0n1ou /dev/nvme0n1p1, cela ne fonctionnera pas et vous obtiendrez un message du type Read NVMe SMART/Health Information failed: NVMe Status 0x4002.

Nate Eldredge
la source