Comment réinitialiser les résultats SMART

16

Comment puis-je réinitialiser les résultats SMART afin qu'il n'enregistre pas les résultats précédents. Ma raison est que je testais les disques durs fermés ensemble sur un boîtier fermé. Cela a fait échouer un des disques durs à la lecture de la température du flux d'air.

Après avoir ouvert le boîtier (ce qui a abaissé la température de tous les disques de 10 degrés Celsius en 5 minutes), puis séparé les disques un peu plus (3 degrés de moins) Tous les résultats étaient bons, mais comme la lecture du flux d'air a échoué lors d'une lecture précédente, elle a toujours montre que l'échec.

Alors, comment puis-je réinitialiser les lectures pour SMART?

entrez la description de l'image ici

Luis Alvarado
la source
1
Je pense que vous pouvez utiliser Mhdd pour désactiver la fonction intelligente.Ce n'est pas la meilleure idée avec les outils de disquette sur sysresccd.org/System-tools ... mais cela pourrait valoir la peine d'être étudié .
Mateo
2
Pourquoi voulez-vous le réinitialiser?
Angelo
Eh bien, c'était essentiellement il y a 3 ans, mais je pense que c'était parce qu'à ce moment-là, le disque dur était dans un endroit qui avait BEAUCOUP de chaleur externe. Après l'avoir déplacé dans une pièce avec un climat plus froid, le problème persistait, bien que la température soit passée de 68 degrés à 37 degrés. Le problème était donc une augmentation de la température extérieure qui a créé le problème au début, mais qui se manifestait toujours après l'avoir déplacé vers un autre endroit.
Luis Alvarado

Réponses:

0

Les disques durs ont de l'espace libre pour des raisons de récupération. La récupération se produit automatiquement. Les outils de récupération ne remappent que les secteurs physiquement défectueux à cet espace disponible. Une fois remappé, lorsqu'une lecture ou une écriture se produit sur un secteur défectueux, le lecteur transforme l'accès à l'espace libre et masque l'erreur.

Pour être honnête, je ne connais aucun moyen de réinitialiser les données SMART. C'est quelque chose que le disque dur maintient en interne, et en tout cas ce serait une mauvaise chose à faire.

SMART signale que votre disque dur tombe en panne! La réinitialisation des compteurs ne changera pas le fait qu'un seuil d'erreur pour le variateur a été dépassé.

Donc NON, vous ne pouvez pas réinitialiser l'historique SMART. Il est installé en usine pour l'évaluation du lecteur en cas de panne. SMART peut uniquement être désactivé ou activé.

J'espère que cela répond à votre question.

Mitch
la source
Salut Mitch, ainsi que expliqué dans la question, l'échec n'est pas réel. C'était parce que tous les disques durs étaient très fermés ensemble sur un espace mal ventilé. Après avoir changé cela et testé à nouveau, cela fonctionnait parfaitement, sauf qu'il mentionnait toujours l'échec passé. Pour le moment, j'ai fait la sataphy sudo smartctl -l suivante, reset / dev / sdd qui a résolu le problème de l'évaluation globale en tenant compte de l'échec précédent qui semble maintenant normal, mais l'échec apparaît toujours pour l'attribut spécifique. Encore une fois, le disque dur n'échoue pas, mais l'erreur précédente s'affiche toujours.
Luis Alvarado
Je comprends, mais cela peut sembler normal, c'est seulement caché. Vous avez demandé si cela pouvait être réinitialisé et la réponse est NON. Même si vous avez réussi à masquer l'erreur, une fois que le lecteur a été transmis au fabricant pour une raison quelconque, il peut découvrir ce qui s'est réellement passé avec le lecteur au fil du temps. Tout ce que je dis, c'est que l'erreur précédente s'affiche toujours, et à moins que vous ne puissiez mettre la main sur les outils utilisés par les fabricants, pour arrêter le statut SMART du lecteur, cela s'affichera toujours.
Mitch
26

En fait, il existe un moyen de réinitialiser les données SMART. Vous n'avez besoin que d'un simple convertisseur rs232 en usb (uart en ttl) et de quelques câbles connectés aux interfaces de diagnostic hdds. (c'est sur le côté droit du port sata, 5 ou 4 broches) Vous devez connecter les câbles RX TX et GND (et le câble d'alimentation bien sûr: D) puis allumer le disque dur et vous y connecter avec du mastic ou hyperterminal (linux peut se connecter avec c'est propre terminal, je suppose), par exemple pour les disques Seagate: pour 7200.10 et les vitesses de transmission plus anciennes sont de 9600 pour 7200.11 et plus récentes de 38400

commandes après la connexion, appuyez sur CTRL + Z puis tapez "/ 1" appuyez sur entrez le type "N1" appuyez sur Entrée quand il a fini de retirer tous les câbles et allumez le disque dur comme d'habitude pour voir les changements :)

pour d'autres informations sur le disque dur, utilisez google :)

MRX
la source
5
Cela ne semble s'appliquer qu'aux disques Seagate, mais vous avez raison, cette vidéo explique le processus.
Adrian Frühwirth
5
Un de mes collègues a contacté Seagate et nous a dit qu'il avait depuis verrouillé cette fonctionnalité afin qu'elle ne soit pas accessible sans un outil propriétaire. Je ne sais pas à quel moment ils l'ont fait.
JFA
4

Les données SMART ne sont pas très standard entre les fabricants, mais le test de température du disque dur devrait indiquer si la température du lecteur a dépassé un seuil dans le passé: http://en.wikipedia.org/wiki/SMART#Known_ATA_S.MART_attributes

L'idée est qu'une surchauffe augmente vos chances d'échec. SMART ne dit pas que votre lecteur est mauvais, mais il a de plus en plus de chances d'échouer à l'avenir.

SMART est censé être un audit de l'historique des lecteurs et est géré par le lecteur lui-même, vous ne pouvez donc pas "réinitialiser" ou "effacer" les valeurs SMART.

Légèrement cubain
la source
3

Le point d'attributs actuels / pires, comme la température, est exactement cela: pour vous dire si le variateur a déjà été en dehors de sa température de fonctionnement maximale, et peut donc avoir subi des dommages permanents.

C'est pourquoi il est dit "échoué dans le passé", pas "échoué maintenant": vous venez juste de toucher le seuil max-temp. Notez que l'affichage des attributs indique "normalisé: 50, seuil: 45, pire: 45". (Ce sont des valeurs normalisées de 0 à 200 comme pour tout autre attribut, pas des températures brutes en degrés Celsius.)

Vous avez également des secteurs défectueux (erreurs de secteur non corrigibles), donc que la brève température élevée en soit la cause ou non, il est probablement temps d'abandonner ce lecteur.

Une meilleure interface utilisateur du logiciel SMART vous montrerait la température actuelle et maximale . par exemple
smartctl -a /dev/sdaou smartctl -x /dev/sda( -ximprime toutes les données SMART et non-SMART disponibles qu'il peut obtenir du lecteur, y compris un journal d'historique de température si le lecteur en a un, avec un graphique à barres ASCII.)

smartctl -x inclut ceci pour un ancien disque dur WD Green 1 To (WD10EADS):

Current Temperature:                    36 Celsius
Power Cycle Min/Max Temperature:     25/42 Celsius
Lifetime    Min/Max Temperature:     35/46 Celsius

Le logiciel que vous utilisez ne montre que la température actuelle, qui est légèrement inférieure au seuil, mais cela ne cachera pas le fait que le lecteur était hors spécifications à un moment donné dans le passé.


Vous pourriez certainement justifier d'ignorer cette température élevée momentanée, si vous l'avez vraiment corrigée en quelques minutes. Mais vous ne pourrez (ou ne devriez pas) jamais faire mentir le lecteur lui-même sur le fait qu'il était au-dessus de sa température maximale nominale pendant un certain temps, et donc l'attribut a échoué dans le passé.

Vous pouvez configurer smartdpour ignorer tout attribut donné afin que vous puissiez toujours recevoir une notification utile si quoi que ce soit d' autre franchit un seuil en territoire officiellement défaillant. : smartd.conf(5)dit:

-i ID [ATA only]Ignorez l'ID du numéro d'attribut du périphérique lors de la vérification de l'échec des attributs d'utilisation. L'ID doit être un entier décimal compris entre 1 et 255. Cette directive modifie le comportement de la directive «-f» et n'a aucun effet sans elle.

Cela est utile, par exemple, si vous avez un disque très ancien et que vous ne souhaitez pas continuer à recevoir des messages concernant l'échec de l'attribut heures sur la durée de vie (généralement l'attribut 9). Cette directive peut apparaître plusieurs fois pour un seul appareil, si vous souhaitez ignorer plusieurs attributs.


Attributs d'historique de température étendus

Je viens de recevoir un nouveau Seagate Barracuda de 6 To (ST6000DM003-2CY186 firmware 0001, un lecteur de 5425 tr / min), qui a des statistiques intéressantes, y compris le temps passé à dépasser les points de fonctionnement min / max, et le haut / bas des températures à court terme et à long terme. .

SCT Status Version:                  3
SCT Version (vendor specific):       522 (0x020a)
Device State:                        Active (0)
Current Temperature:                    33 Celsius
Power Cycle Min/Max Temperature:     27/33 Celsius
Lifetime    Min/Max Temperature:     27/33 Celsius
Under/Over Temperature Limit Count:   0/0

SCT Temperature History Version:     2
Temperature Sampling Period:         3 minutes
Temperature Logging Interval:        59 minutes
Min/Max recommended Temperature:     14/55 Celsius
Min/Max Temperature Limit:           10/60 Celsius
Temperature History Size (Index):    128 (2)

Et dans la section détaillée:

0x05  =====  =               =  ===  == Temperature Statistics (rev 1) ==
0x05  0x008  1              33  ---  Current Temperature
0x05  0x010  1               -  ---  Average Short Term Temperature
0x05  0x018  1               -  ---  Average Long Term Temperature
0x05  0x020  1              33  ---  Highest Temperature
0x05  0x028  1              30  ---  Lowest Temperature
0x05  0x030  1               -  ---  Highest Average Short Term Temperature
0x05  0x038  1               -  ---  Lowest Average Short Term Temperature
0x05  0x040  1               -  ---  Highest Average Long Term Temperature
0x05  0x048  1               -  ---  Lowest Average Long Term Temperature
0x05  0x050  4               0  ---  Time in Over-Temperature
0x05  0x058  1              55  ---  Specified Maximum Operating Temperature
0x05  0x060  4               0  ---  Time in Under-Temperature
0x05  0x068  1              13  ---  Specified Minimum Operating Temperature

(Le lecteur n'est allumé que depuis quelques minutes; c'est probablement la raison pour laquelle il n'y a -pas de données dans certains champs.)

Si vous conduisez a ces attributs étendus, vous pouvez montrer à quelqu'un que le temps passé en dehors de la température autorisée était très court (si c'est le cas). Vraisemblablement, si vous alliez modifier les données SMART, vous auriez simplement fait cela et supprimé toute mention de ce qu'elles soient hors de portée, mais vous ne pouvez évidemment pas faire confiance à 100% aux données d'un lecteur de seconde main qui quelqu'un essaie de vous vendre.

Voir /superuser/1389522/what-does-it-mean-when-my-new-hdd-reports-errors-at-a-time-that-shouldnt-exist pour en savoir plus sur les lecteurs utilisés avec "odomètre rollback" sur leur attribut "Power_On_Hours" par exemple.

Peter Cordes
la source
Merci Peter pour l'analyse approfondie ici. Très appréciée.
Luis Alvarado
0

À ma connaissance, la seule façon de l'arrêter est de désactiver SMART dans le BIOS. Cependant, cela ne fera qu'arrêter le MATÉRIEL.

Votre système d'exploitation demandera toujours au lecteur ses informations SMART et vous dira qu'il échoue.

Jesseryte
la source