Méthode rapide pour déterminer la santé du disque SSD?

13

J'ai un disque Intel X-25M qui a été marqué "échoué" deux fois dans une matrice de stockage ZFS, comme indiqué ici . Cependant, après avoir retiré le lecteur, il semble se monter, lire et écrire sur d'autres ordinateurs (Mac, PC, boîtier USB, etc.)

Existe-t-il un bon moyen de déterminer l'état de santé actuel du lecteur? Je pense que l'échec précédent de la solution ZFS était la convergence des bogues, des mauvais rapports d'erreur et du matériel. Il semble cependant que ce lecteur ait une certaine vie.

ewwhite
la source
est-ce un g1 ou un g2?
Jim B
Il s'agit d'un lecteur G2 120 Go X25-M.
ewwhite

Réponses:

12

Un bon moyen, mais non infaillible, de vérifier la santé de n'importe quel lecteur est de vérifier les attributs SMART.

Vous trouverez ci-dessous l'ensemble d'attributs SMART pour un disque Intel X25-M G2 160 Go, pris à l'aide de smartctl v5.41. (La version est importante, les versions antérieures de smartctl avaient des mappages de noms d'attributs différents et ne comprenaient pas correctement le tableau spécifique pour ce lecteur).

# ./smartctl -data -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.18-194.32.1.el5] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 5
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED     RAW_VALUE
  3 Spin_Up_Time            0x0020   100   100   000    Old_age   Offline      -       0
  4 Start_Stop_Count        0x0030   100   100   000    Old_age   Offline      -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       1
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       4076
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       67
192 Unsafe_Shutdown_Count   0x0032   100   100   000    Old_age   Always       -       30
225 Host_Writes_32MiB       0x0030   200   200   000    Old_age   Offline      -       148418
226 Workld_Media_Wear_Indic 0x0032   100   100   000    Old_age   Always       -       755
227 Workld_Host_Reads_Perc  0x0032   100   100   000    Old_age   Always       -       49
228 Workload_Minutes        0x0032   100   100   000    Old_age   Always       -       16956537
232 Available_Reservd_Space 0x0033   099   099   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   098   098   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   099    Pre-fail  Always       -       0

Cela montre que le lecteur a eu 1 secteur réaffecté, a utilisé 1% de son espace réservé disponible (attribut 232) et 2% de ses cycles de programme / effacement projetés (attribut 233). Il a été écrit 148418 * 32 Mo (attribut 225).

Si le lecteur affiche un nombre important de secteurs réaffectés, cela peut être un sujet de préoccupation, car cela indique probablement une puce flash défaillante (de la même manière qu'un nombre important de secteurs réaffectés sur un disque en rotation indique généralement des erreurs de surface ). De bout en bout sont également mauvais - j'ai eu quelques disques X25-M G2 160 Go qui échouent avec des rapports d'erreurs de bout en bout volumineux (> 1000). Cependant, il n'y a vraiment que deux attributs de condition d'erreur utiles pour ces disques, car la plupart des attributs SMART utiles pour les disques normaux ne s'appliquent pas aux SSD.

Cependant, SMART n'est généralement pas considéré comme 100% fiable. L'étude de Google sur les pannes de disque a révélé que, même s'il existait de bonnes corrélations entre les différents indicateurs d'alerte précoce SMART et la panne de disque, ce n'était pas un outil utile pour prédire une panne de disque individuelle. Pour cette raison, j'utilise généralement SMART comme moyen de prouver qu'un lecteur est mauvais (si des erreurs apparaissent, cela va probablement échouer très bientôt), plutôt que de prouver qu'un lecteur est toujours bon.

Daniel Lawson
la source
1
Notez que l'étude de Google s'est concentrée sur les indications de pré-défaillance de SMART, qui se sont avérées peu fiables. Les rapports sur les conditions de défaillance sont un peu plus précis.
Chris S
2

Bien qu'il soit conçu pour les disques durs "traditionnels", l'utilitaire "badblocks" pourrait être d'un certain avantage car il est censé exercer tous les secteurs mappables sur le disque. Avec la prévention de la fragmentation SSD et les remappages internes, il ne pourra pas vous dire avec certitude que le lecteur est bon. Cependant, s'il vous dit que le lecteur est mauvais, je jetterais sûrement le lecteur comme mort.

bot403
la source
1

HD Tune (et HD Tune Pro ) sont d'excellents outils pour mesurer la santé et les performances de votre disque SSD. La version gratuite (HD Tune) a un ensemble de fonctionnalités très limité, mais l'analyse de la santé en fait partie, alors vous avez de la chance. La version Pro a une période d'essai de 15 jours que je recommande fortement d'essayer, elle vous donnera une excellente analyse approfondie sur la performance de votre SSD.

András Szepesházi
la source