Contexte
Mon système de bureau personnel à la maison contient 5 disques SATA. Récemment, mon système a commencé à échouer de manière étrange comme des paniques aléatoires du noyau et je l'ai finalement tracé à des dégradations aléatoires sur la matrice RAID. Parfois, je pouvais démarrer, d'autres fois je ne pouvais pas et ainsi de suite. Après avoir chassé les problèmes logiciels pendant un moment, je suis finalement allé retirer les disques et j'ai découvert la vraie raison pour laquelle ils échouaient: ils étaient plus chauds qu'un barbecue le 4 juillet! Le ventilateur avant du boîtier s'était grippé et le ventilateur PS avait un connecteur d'alimentation lâche coincé dans sa grille, de sorte que l'intérieur du boîtier était en train de cuire.
En guise de retenue, j'ai trouvé un ventilateur de maison et j'ai refroidi cette ventouse. Il fonctionnait très bien avec tout ce qui était agréable et froid. A peu près à cette époque, j'ai appris à obtenir des relevés de température de lecteur à partir de SMART
for i in a b c d e; do
sudo smartctl --all /dev/sd$i | grep Temperature_Celsius
done
Maintenant, je sais qu'avec mon boîtier ouvert un ventilateur de maison nettoyant en permanence les toiles d'araignées, les disques fonctionnent à 31-32 °. Un test rapide sans ventilation pour reproduire l'état défaillant montre que les disques ont atteint les 40 ans assez rapidement. Je ne sais pas à quel point c'était mauvais pendant l'échec réel ou combien de temps cela a été comme ça.
Dans cet esprit, j'ai remplacé les ventilateurs défaillants, j'en ai ajouté quelques autres, j'ai mis à niveau celui avant qui souffle sur les disques de 80 mm à 120 mm et je l'ai refermé. Avec elle à nouveau debout, la plage de températures est maintenant généralement assise à 32 ° en bas de l'ensemble et 37 ° en haut.
La question
Quelle est la plage de températures de fonctionnement sécurisée générale pour les disques SATA? Le 37 ° devrait-il être une préoccupation ou les dommages au disque ne sont-ils pas un problème avant un certain point?
Bien que les disques semblent bien fonctionner maintenant, quelle est la probabilité que l'exposition passée à la chaleur les rende susceptibles de tomber en panne maintenant?
Réponses:
37 degrés ne devraient pas du tout être un problème. Naturellement, les disques durs diffèrent dans leurs spécifications, certains peuvent fonctionner plus chaud que les autres. Vous devez vérifier les spécifications publiées des lecteurs que vous possédez. Par exemple, la température de fonctionnement du WD Caviar Black 1 To est de -0 ° C à 60 ° C.Bien sûr, vous ne voudriez pas que votre lecteur fonctionne à 60 °, car cela pourrait réduire sa durée de vie.
Google a publié une étude très intéressante (PDF) sur la santé et la durée de vie des disques durs, basée sur les données collectées sur leurs systèmes (plusieurs milliers de disques durs). Cette étude indique que:
Leur graphique montre que le taux de défaillance ne monte pas jusqu'à ce que la température du lecteur dépasse 45 degrés.
la source
Ce n'est que mon expérience personnelle limitée, mais j'ai exécuté quelques disques dans le 40C supérieur sans problèmes pendant 2-3 ans, car j'utilisais un boîtier silencieux (refroidi par un petit ventilateur pour éviter d'atteindre 50C). À ces températures, je supposerais une durée de vie plus courte et une mort rapide, plutôt qu'une corruption aléatoire des données, mais je peux me tromper. Dans tous les cas, tout ce qui est inférieur à 40C-42C est très bien.
Mais ne sous-estimez pas les autres facteurs susceptibles de jouer un rôle dans la corruption des données:
1) Le pont sud qui abrite le chipset du contrôleur IDE / RAID est souvent refroidi uniquement par un petit dissipateur thermique. Ils ont tendance à chauffer dans des conditions normales, donc une augmentation de la température ambiante en raison d'un manque de flux d'air dans le boîtier et de nombreux disques durs pourrait vraisemblablement entraîner une corruption des données.
2) La surchauffe de la RAM ou du CPU est un coupable commun des erreurs de mémoire CRC, ce qui se traduit par une corruption des données. Surveiller la température du processeur et effectuer des tests de mémoire est essentiel face à la corruption de données.
Si vos indicateurs SMART actuels sont corrects et ne montrent pas de nombres de secteurs non corrigeables, je considérerais les lecteurs comme sûrs à utiliser.
la source
Le message initial a déclaré que l'utilisateur ne savait pas à quel point ses disques étaient chauds - certains disques enregistrent ce paramètre et il est accessible via les informations SMART. La sentinelle du disque dur est une pièce de logiciel de sécurité qui indique cette température maximale pendant toute la durée de vie.
J'ai vu des résultats pour les disques Maxstor, WD et Seagate
Quelques-uns de mes lecteurs USB externes que j'utilise pour la sauvegarde affichent des températures maximales respectives de 63 et 64 C! J'ai maintenant construit un refroidisseur pour le lecteur externe
la source
J'ai lu le rapport mentionné ci-dessus et vérifié les plages de températures de fonctionnement pour les disques durs Samsung, WD et hitachi. Sur la base de recherches, j'ai conclu que les variateurs fonctionnant entre 30 et 45 degrés offrent le capot de défaillance le moins probable; Une température élevée SMART jusqu'à 55 degrés n'est pas une source de préoccupation; et que des températures Peek supérieures à 60 degrés indiqueraient une réduction de la durée de vie du lecteur.
Mes propres tests indiquent qu'une augmentation de jusqu'à 10 degrés est à prévoir pendant les périodes d'accès difficile.
Il semble y avoir un facteur inconnu au travail qui provoque des taux de défaillance anormaux dans les disques externes. Bien que la chaleur semble faire partie du problème, ce n'est pas toute la réponse. Je conseillerais à tous les utilisateurs de disques externes de surveiller attentivement les températures chaque fois qu'il y a un changement dans la nature de l'utilisation ou de l'environnement des disques. Cela semble être un problème "inconnu" (pas habituel) qui conduit à une surchauffe inattendue de ces disques.
Je rejette actuellement l'explication du virus informatique, de l'ignorance des utilisateurs, des mauvais protocoles USB et du placement des disques dans un mauvais emplacement.
la source