Quelle est la température limite de sécurité pour un disque dur SATA grand public?

16

Contexte

Mon système de bureau personnel à la maison contient 5 disques SATA. Récemment, mon système a commencé à échouer de manière étrange comme des paniques aléatoires du noyau et je l'ai finalement tracé à des dégradations aléatoires sur la matrice RAID. Parfois, je pouvais démarrer, d'autres fois je ne pouvais pas et ainsi de suite. Après avoir chassé les problèmes logiciels pendant un moment, je suis finalement allé retirer les disques et j'ai découvert la vraie raison pour laquelle ils échouaient: ils étaient plus chauds qu'un barbecue le 4 juillet! Le ventilateur avant du boîtier s'était grippé et le ventilateur PS avait un connecteur d'alimentation lâche coincé dans sa grille, de sorte que l'intérieur du boîtier était en train de cuire.

En guise de retenue, j'ai trouvé un ventilateur de maison et j'ai refroidi cette ventouse. Il fonctionnait très bien avec tout ce qui était agréable et froid. A peu près à cette époque, j'ai appris à obtenir des relevés de température de lecteur à partir de SMART

for i in a b c d e; do
    sudo smartctl --all /dev/sd$i | grep Temperature_Celsius
done

Maintenant, je sais qu'avec mon boîtier ouvert un ventilateur de maison nettoyant en permanence les toiles d'araignées, les disques fonctionnent à 31-32 °. Un test rapide sans ventilation pour reproduire l'état défaillant montre que les disques ont atteint les 40 ans assez rapidement. Je ne sais pas à quel point c'était mauvais pendant l'échec réel ou combien de temps cela a été comme ça.

Dans cet esprit, j'ai remplacé les ventilateurs défaillants, j'en ai ajouté quelques autres, j'ai mis à niveau celui avant qui souffle sur les disques de 80 mm à 120 mm et je l'ai refermé. Avec elle à nouveau debout, la plage de températures est maintenant généralement assise à 32 ° en bas de l'ensemble et 37 ° en haut.

La question

Quelle est la plage de températures de fonctionnement sécurisée générale pour les disques SATA? Le 37 ° devrait-il être une préoccupation ou les dommages au disque ne sont-ils pas un problème avant un certain point?

Bien que les disques semblent bien fonctionner maintenant, quelle est la probabilité que l'exposition passée à la chaleur les rende susceptibles de tomber en panne maintenant?

Caleb
la source
L'une des choses que j'ai remarquées en particulier avec les nouveaux disques fonctionnant avec des refroidisseurs de technologie, ils deviennent beaucoup plus chauds lorsqu'ils sont utilisés intensivement. Bien que mes légumes verts (par exemple) soient pratiquement froids la plupart du temps lorsque je suis là à regarder / toucher, ils se réchauffent quand même quand ils travaillent dur. Même chose avec les puces du contrôleur Sata, Suuuure le contrôleur Intel n'a pas besoin de la grande synchronisation passive que je lui ai ajoutée, jusqu'à ce que je le sonde quand il a réellement travaillé dur. Je dis que les tests (en regardant) représentent rarement la réalité lorsque les choses vont mal. Tout le reste a été dit, ils peuvent facilement travailler 50 * C
Psycogeek
Connexe: serverfault.com/questions/25611/…
sampablokuper

Réponses:

25

37 degrés ne devraient pas du tout être un problème. Naturellement, les disques durs diffèrent dans leurs spécifications, certains peuvent fonctionner plus chaud que les autres. Vous devez vérifier les spécifications publiées des lecteurs que vous possédez. Par exemple, la température de fonctionnement du WD Caviar Black 1 To est de -0 ° C à 60 ° C.Bien sûr, vous ne voudriez pas que votre lecteur fonctionne à 60 °, car cela pourrait réduire sa durée de vie.

Google a publié une étude très intéressante (PDF) sur la santé et la durée de vie des disques durs, basée sur les données collectées sur leurs systèmes (plusieurs milliers de disques durs). Cette étude indique que:

Dans l'ensemble, nos expériences ne peuvent confirmer les effets de température précédemment signalés que pour le haut de gamme de notre plage de température et en particulier pour les disques plus anciens. Dans les plages de températures inférieures et moyennes, des températures plus élevées ne sont pas associées à des taux de défaillance plus élevés. C'est un résultat assez surprenant, qui pourrait indiquer que les concepteurs de centres de données ou de serveurs ont plus de liberté que ce que l'on pensait auparavant lors du réglage des températures de fonctionnement pour les équipements qui contiennent des unités de disque.

Leur graphique montre que le taux de défaillance ne monte pas jusqu'à ce que la température du lecteur dépasse 45 degrés.

haimg
la source
3

Ce n'est que mon expérience personnelle limitée, mais j'ai exécuté quelques disques dans le 40C supérieur sans problèmes pendant 2-3 ans, car j'utilisais un boîtier silencieux (refroidi par un petit ventilateur pour éviter d'atteindre 50C). À ces températures, je supposerais une durée de vie plus courte et une mort rapide, plutôt qu'une corruption aléatoire des données, mais je peux me tromper. Dans tous les cas, tout ce qui est inférieur à 40C-42C est très bien.

Mais ne sous-estimez pas les autres facteurs susceptibles de jouer un rôle dans la corruption des données:

1) Le pont sud qui abrite le chipset du contrôleur IDE / RAID est souvent refroidi uniquement par un petit dissipateur thermique. Ils ont tendance à chauffer dans des conditions normales, donc une augmentation de la température ambiante en raison d'un manque de flux d'air dans le boîtier et de nombreux disques durs pourrait vraisemblablement entraîner une corruption des données.

2) La surchauffe de la RAM ou du CPU est un coupable commun des erreurs de mémoire CRC, ce qui se traduit par une corruption des données. Surveiller la température du processeur et effectuer des tests de mémoire est essentiel face à la corruption de données.

Si vos indicateurs SMART actuels sont corrects et ne montrent pas de nombres de secteurs non corrigeables, je considérerais les lecteurs comme sûrs à utiliser.

mtone
la source
0

Le message initial a déclaré que l'utilisateur ne savait pas à quel point ses disques étaient chauds - certains disques enregistrent ce paramètre et il est accessible via les informations SMART. La sentinelle du disque dur est une pièce de logiciel de sécurité qui indique cette température maximale pendant toute la durée de vie.

J'ai vu des résultats pour les disques Maxstor, WD et Seagate

Quelques-uns de mes lecteurs USB externes que j'utilise pour la sauvegarde affichent des températures maximales respectives de 63 et 64 C! J'ai maintenant construit un refroidisseur pour le lecteur externe

JohnM
la source
0

J'ai lu le rapport mentionné ci-dessus et vérifié les plages de températures de fonctionnement pour les disques durs Samsung, WD et hitachi. Sur la base de recherches, j'ai conclu que les variateurs fonctionnant entre 30 et 45 degrés offrent le capot de défaillance le moins probable; Une température élevée SMART jusqu'à 55 degrés n'est pas une source de préoccupation; et que des températures Peek supérieures à 60 degrés indiqueraient une réduction de la durée de vie du lecteur.

Mes propres tests indiquent qu'une augmentation de jusqu'à 10 degrés est à prévoir pendant les périodes d'accès difficile.

Il semble y avoir un facteur inconnu au travail qui provoque des taux de défaillance anormaux dans les disques externes. Bien que la chaleur semble faire partie du problème, ce n'est pas toute la réponse. Je conseillerais à tous les utilisateurs de disques externes de surveiller attentivement les températures chaque fois qu'il y a un changement dans la nature de l'utilisation ou de l'environnement des disques. Cela semble être un problème "inconnu" (pas habituel) qui conduit à une surchauffe inattendue de ces disques.

Je rejette actuellement l'explication du virus informatique, de l'ignorance des utilisateurs, des mauvais protocoles USB et du placement des disques dans un mauvais emplacement.

Brian
la source
2
Bienvenue. Le but de ce site est de compiler des questions et des réponses de haute qualité sur lesquelles les gens peuvent se fier pour référence. Quelques éléments dans votre réponse peuvent inciter les lecteurs à s'interroger. Vous discutez de la recherche et des tests. Si cela est publié, il serait utile de le citer. Votre utilisation du mot «inconnu» soulève une question sur vos qualifications. Il serait utile de décrire les facteurs connus que vous excluez et les problèmes «habituels» qui provoquent une surchauffe. Décrivez vos tests et le nombre de lecteurs sur lesquels vous basez votre conclusion pour que les gens puissent comprendre la portée.
fixer1234