Comment interpréter les résultats HDD SMART?

58

Mon ordinateur portable a récemment commencé à devenir un peu peu fiable et, pour une raison quelconque, j'ai commencé à soupçonner que mon disque dur commençait à tomber en panne. Après un peu de chasse sur Internet, j'ai trouvé l'Utilitaire de disque d'Ubuntu dans le menu Système et j'ai lancé les diagnostics SMART longs à partir de cela.

Cependant, étant donné que la documentation de Disk Utility est très médiocre ( palimpsest?), Je ne sais pas comment interpréter les résultats:

Valeur supérieure à 50 millions pour un taux d'erreur de lecture, pourtant le test est bon?!

Par exemple, le taux d'erreur de lecture est supérieur à 50 millions (!), Mais l'évaluation est considérée comme "bonne".

Quelqu'un pourrait-il alors m'expliquer comment interpréter les résultats de ces tests (en particulier les nombres normalisé, pire, seuil et valeur)? Et peut-être me direz-vous ce qu'ils pensent des résultats obtenus avec mon disque dur? (Merci)

Marty
la source
Le "matériel ECC a-t-il récupéré" la même valeur que le "taux d'erreur de lecture"? Mon disque a 676 cycles d'alimentation, a été alimenté pendant 285 jours et comporte 193 erreurs. Comparé au mien, votre disque contient trop d’erreurs, mais je ne fais que spéculer ici. Quoi qu'il en soit, je viens de m'inquiéter oO
danizmax
Yip - les deux chiffres sont les mêmes!
Marty

Réponses:

54

Vous avez une bonne description du fonctionnement de SMART sur wikipedia . Mais une introduction rapide:

  • Valeur: Il s'agit de la valeur brute indiquée par le contrôleur. Il s'agit généralement d'une valeur facile à comprendre (comme le nombre d'heures de fonctionnement ou la température), mais parfois non (comme le taux d'erreur de lecture). Différents fabricants peuvent utiliser différentes structures et significations pour ces données.

  • Normalisé: C'est la valeur ci-dessus normalisée, donc une valeur plus élevée est toujours meilleure. Ainsi, un taux de 114 en lecture / erreur est supérieur à 113. Encore une fois, la façon dont votre disque dur convertit les données brutes en valeur normalisée est spécifique au fournisseur.

  • Pire: La valeur normalisée la plus mauvaise que votre lecteur a eu par le passé (où 99 correspond probablement au réglage d'usine).

  • Seuil: lorsque la valeur normalisée est inférieure à cette valeur, le lecteur est susceptible de tomber en panne.

Donc, votre disque dur semble aller bien. La valeur du taux d'erreur de lecture n'est pas le nombre de fois où votre lecteur a échoué, mais une structure de données qui dépend du fabricant de votre disque.

Javier Rivera
la source
Si un lecteur particulier ne signale pas de valeur normalisée , cela signifie-t-il pire et le seuil sera-t-il indiqué ou est-ce que tous les lecteurs utilisent des valeurs normalisées et que seuls certains choisissent de les étiqueter uniquement comme "valeur"?
DeveloperACE
25

Oui, la valeur brute du taux d'erreur de lecture est généralement absurde. Les valeurs que vous souhaitez surveiller sont le nombre de secteurs réaffecté, le nombre en attente et le fichier offline non corrigible. Ce sont le nombre de secteurs défectueux qui ont été, sont en attente d’être ou ne peuvent pas être corrigés, et les valeurs brutes qui y figurent ont généralement un sens et sont le nombre de secteurs.

Si la lecture d'un secteur échoue, il devient en attente. La prochaine fois que vous essayez d'écrire dans ce secteur, le lecteur tente de le réécrire. Si cela fonctionne, tout revient à la normale. S'il ne peut pas écrire correctement le secteur, il le réaffectera du pool de réserve. S'il ne peut pas le faire (peut-être qu'il a déjà utilisé le pool de réserve?), Il devient alors offline_uncorrectable et essaie de lire ou d'écrire dessus, mais il y a erreur.

psusi
la source
1
J'ai un lecteur qui ne fait quasiment que rater le taux d'erreur de lecture brute. Le test échoue seulement après que le lecteur a fonctionné pendant un certain temps, peut-être 15 minutes; Sous Windows, le symptôme est que tout accès de disque bloque le processus. J'utilise donc les outils Ubuntu pour déterminer ce qui ne va pas, mais je ne sais pas ce qu'il dit être faux avec le disque, car le taux d'erreur de lecture ne le fait pas. Cela ne semble pas indiquer une panne imminente du lecteur, mais celui-ci a définitivement des problèmes!
Michael
Je devrais également ajouter que les résultats du test eux-mêmes sont ambigus. Le test global indique qu’il a échoué, mais le test du taux d’erreur de lecture, malgré une valeur ridicule (100/100, pire, normalisé), indique "Ok".
Michael
9

le psusi le cloue.

Si vous lisez les fiches techniques (livres blancs), par exemple sur seagate.com, vous verrez comment les disques durs sont fabriqués, testés et comment ils fonctionnent réellement. Il n’existe pas de disque dur parfait, n’a jamais existé, n’existera jamais (histoire et fait). Autrefois, nous devions entrer les secteurs défectueux dans le contrôleur de disque dur à partir d'une liste sur papier fournie avec le nouveau lecteur, de sorte que le contrôleur les ignore.

Les lecteurs modernes ont une correction d'erreur. Dès le premier jour, les secteurs sont mauvais.

Donc, ils les cartographient, cela signifie que le lecteur ignore les secteurs défectueux. En fait, ils sont "logiquement échangés" - le secteur défectueux est mappé sur un nouveau, bon secteur de cylindre de rechange (il a des cylindres de rechange - considérez les cylindres comme des pistes). Tout cela est transparent pour le monde extérieur - à l'exception de SMART util.

Chaque fabricant peut agir à sa guise. Certains fixent donc le nombre d'erreurs à zéro, même s'il peut y avoir 10 secteurs défectueux dès que le lecteur est fabriqué.

Le micrologiciel du lecteur contient une règle des 3 fois: il lit un secteur 3 fois et si les 3 fois il est mauvais, il peut effectuer un "recalibrage" à la volée et lire 3 fois plus. Si le lecteur n'est toujours pas correct, il mappera ce secteur sur l'un des secteurs en réserve. Ceci est profondément ancré dans le micrologiciel, mais se produit continuellement en arrière-plan, le tout étant transparent pour l'utilisateur.

Que le fabricant choisisse de signaler les erreurs brutes lorsqu'il y a 3 mauvaises lectures ou après le calibrage est à leur charge. Donc, comme il le dit ci-dessus, ce n'est pas important à moins que vous ayez plusieurs disques du même type et que vous voyiez des tendances étranges.

Point 2: tous les disques durs ont des erreurs de lecture naturelles, vous pouvez aussi l’apprendre chez Seagate, si vous le souhaitez. mais ils ont tous des erreurs à la volée. et sont lus à nouveau et réussissent généralement le test des erreurs CRC. si ce n’est pas le cas, le lecteur essaie de l’échanger. Si vous utilisez le disque à froid, cela durera longtemps et vous ne manquerez probablement jamais de cylindres de rechange. mais regardez comme le dit le psusi!

Je tape ceci, sur un vieux PC, exécutant l’un des premiers disques durs de 1 Go. et est toujours bon. (im sauvegardé) (pas de refroidissement jamais ...) la chaleur est le tueur n ° 1 et les surtensions, je cours un UPS. salut et bonne journée. J'espère que ça aide. (avez-vous déjà vu un crash de disque dur de DatA General? et remplissez la pièce de grandes quantités de laine d’aluminium, de bouclages frisés? A l’époque, vous vous amuserez beaucoup ... jamais un moment d’ennui ...

jtgh
la source