Comment rendre le disque dur de la machine d'usine plus durable? Quelle est sa durée de vie estimée?

9

Je me demande comment puis-je rendre le disque dur plus durable? Plus précisément, je travaille dans un environnement d'usine. Et presque tous les quelques mois, le disque dur de certaines machines d'usine est corrompu, voire irréparable. Nous implémentons déjà plusieurs SSD sur certains d'entre eux, mais cela ne nous aide pas beaucoup. Ils sont également corrompus sur la machine d'usine avec une tâche lourde.

Donc, chaque fois que cela se produit, nous restaurons toujours en utilisant notre image de sauvegarde. Et nous attachons déjà tout le disque dur avec un amortisseur pour réduire le tremblement.

Y a-t-il une autre option ou prévention que nous pourrions utiliser? Peut-être ajouter un matériau anti-aimant pour éviter la friction de l'aimant, ou autre chose? Et de quel matériel avons-nous besoin?

Edit: Machine d'usine avec une tâche lourde que je mentionne ci-dessus essentiellement la machine pour créer un corps métallique de voiture et un moule de châssis de voiture.

Et quand je voulais dire que le disque est corrompu, cela signifie illisible. Le disque entier. Pas les fichiers de programme ou les logiciels. Il ne démarrera donc pas du tout.

adadion
la source
10
Les SSD ne devraient pas être affectés par les aimants. Les problèmes les plus probables sont la température, l'humidité, la contamination chimique (conduisant à la corrosion des connexions électriques, etc.), la poussière et la saleté (empêchant un bon refroidissement de l'air) ou l'alimentation électrique hors spécifications - par exemple les pointes de puissance causées par les gros moteurs électriques arrêt et démarrage. Sans en savoir plus sur «l'usine», il est impossible de deviner ce qui est le plus important.
alephzero
@alephzero Désolé, la machine lourde que je mentionne ci-dessus est une machine d'usine pour fabriquer la carrosserie et le moule du châssis. Pouvez-vous partager une solution possible en fonction de votre expérience concernant mes problèmes? Parce que cela n'arrive qu'aux machines avec des tâches lourdes.
2017
6
Les disques durs contiennent des composants mécaniques très sensibles, donc je recommanderais certainement l'utilisation de disques SSD pour tous les emplacements mobiles / vibrants. Cependant, à la lecture de votre numéro, je pense que votre problème principal a également une chance d'être un problème de haute tension. Si votre alimentation n'est pas stable, cela affectera la lecture et l'écriture et finira par endommager certains composants.
Jonathan
4
Êtes-vous sûr qu'il s'agit en fait d'un problème matériel et non lié au logiciel? Je comprends les problèmes avec les disques durs, mais les SSD devraient être à l'abri de la plupart de ces problèmes. Pouvez-vous fournir plus de détails sur la «corruption» que vous voyez?
jcaron
1
En plus d'un onduleur, envisagez d'utiliser deux SSD (ou plus) dans une configuration RAID1. Si vous configurez la surveillance des erreurs RAID, cela devrait vous permettre de remplacer un disque défectueux sans avoir à restaurer à partir de la sauvegarde.
Tor Klingberg

Réponses:

14

Très probablement, le tueur de SSD est électrique. Nous ne pouvons pas entièrement exclure les vibrations mécaniques, mais les SSD sont assez robustes mécaniquement. Un simple montage en caoutchouc augmenterait encore la résilience. Assurez-vous également que les câbles d'alimentation et de données sont suffisamment lâches. Les vibrations peuvent les faire se détacher lorsqu'elles sont sous tension.

Donc, pour aborder la fiabilité électrique, nous devons considérer deux facteurs. Premièrement, la machinerie lourde peut tirer de gros courants de l'alimentation. Cela pourrait provoquer des chutes de tension, ce qui pourrait à son tour affecter négativement le SSD. Ceci est facilement résolu par un onduleur en ligne. Essentiellement, ce type d'UPS alimente l'ordinateur à partir d'une batterie, tandis que l'alimentation secteur est utilisée pour charger la batterie.

Un problème plus inhabituel pourrait être le rayonnement électromagnétique. Les machines de forte puissance auront de grands courants en marche, souvent à 50 ou 60 Hz. Sans le vouloir, cela fera que les câbles agiront comme des antennes. Les gros câbles de la machine jouent le rôle d'expéditeurs et les câbles du SSD peuvent servir de récepteurs. La solution ici est d'avoir une cage de Faraday appropriée, idéalement mise à la terre. C'est pourquoi les boîtiers PC normaux sont en métal; ils fonctionnent comme des cages de Faraday, gardant le rayonnement EM dans des bandes de fréquences entre 50 Hz et plusieurs Ghz.

MSalters
la source
5
+1 pour avoir mentionné les effets électromagnétiques. (Je ne sais pas à quel point ce serait grave pour les cas de PC que nous envisageons).
Gürkan Çetin
Je pense aussi que c'est la réponse au problème, mais pas à la question du titre :) vous obtenez quand même mon vote.
Jonathan
Il est tout à fait probable que la machinerie lourde est à l' origine des problèmes avec le sol qui pourraient être soulagées par des motifs isolés.
chrylis -on strike-
1
Il semble que les chutes de tension soient les principaux problèmes. Nous implémentons des onduleurs en ligne pour certains d'entre eux, et le compteur affiche un excellent résultat stable. Et en plus, nous avons mis la cage de Faraday mise à la terre à 2 d'entre eux (les anciens). Superbe!! Est-ce que le SSD projeté sera installé sur chacun d'eux, et fera l'ancien comme sauvegarde.
adadion
11

Tout d'abord, les problèmes électriques et magnétiques ne sont pas aussi graves que les problèmes de vibrations et de contamination de l'air. L'humidité de l'air plus la poussière ou les produits chimiques peuvent se corroder ou se raccourcir assez facilement, et dans nos installations, ils sont les principales causes de défaillance si les appareils ne sont pas correctement protégés.

La meilleure option consiste simplement à conserver tout ce qui n'est pas nécessaire sur le site de production hors site. Gardez les contrôleurs intégrés minimalistes près des machines, gardez les PC dans un bureau soigné communiquant avec les contrôleurs via LAN.

Si ce n'est pas possible, vous avez besoin d'étuis scellés. Éventuellement avec des éléments de transfert de chaleur, si nécessaire; des boîtes hermétiques qui gardent la plupart de l'humidité à l'extérieur, de la silice à l'intérieur pour absorber le reste de l'humidité - ni la poussière sèche ni l'humidité de l'air pur ne sont un gros problème, mais combinées, elles conduisent rapidement à l'oxydation des contacts, d'autres problèmes liés à la corrosion.

D'après mon expérience, les perturbations électromagnétiques sont rarement suffisamment puissantes pour causer des dommages durables. Ils peuvent mettre un appareil hors tension, forçant un redémarrage, mais un appareil bien construit s'en remettra. Les surtensions sont une autre affaire; sans une bonne protection contre les surtensions, vous pouvez voir des dommages aléatoires des pièces.

Enfin, les vibrations. La vibration conduite par le sol est facilement réduite à des niveaux négligeables grâce à un tapis éponge ou similaire. La vibration d'une machine, dans le cas où l'appareil est directement attaché à la machine ... il y a peu de choses à faire. Il existe des systèmes d'amortissement, mais ils ne sont efficaces que contre certaines échelles de vibration ... vraiment, il suffit de déplacer ce boîtier de commande à 2 mètres.

De plus, la plage de température doit être "dans des niveaux acceptables". Vous verrez de la corruption sur les appareils en surchauffe et l'humidité se condensera sur les appareils trop froids. C'est rarement une préoccupation sur un plancher de production, où trop de machines en dépendent, mais lorsque vous scellez le disque (intentionnellement ou non, par exemple à travers la poussière), vous verrez une surchauffe.

SF.
la source
2
Vous pouvez utiliser des extensions KVM et des extensions USB pour éloigner les machines des sources de chaleur / vibration / contamination, y compris de l'autre côté d'un mur.
Chris H
@ChrisH: Jamais fait ça, mais ça devrait marcher. Dans nos cas, le contrôleur intégré minimal dans une boîte hermétique se trouve juste à côté des machines lourdes au fond de la mine, fournissant une petite console pour un contrôle immédiat à l'aide d'un clavier à membrane étanche installé en face de la boîte, tandis qu'un PC pour tous les utilisateurs réguliers les opérations et la surveillance se trouvent dans un centre de contrôle à plusieurs kilomètres. Il y a un commutateur Ethernet avec des prises de rechange dans cette boîte, donc si vous avez besoin d'un contrôle sur site pour une raison quelconque, vous pouvez apporter un ordinateur portable. Mais ce n'est que pour l'entretien, pas pour une utilisation régulière.
SF.
J'ai exécuté USB sur CAT5 (extension propriétaire) pour clavier, souris et webcam et VGA sur un autre CAT5 (autre boîtier propriétaire) sur 100 m pour permettre à un système (un spectromètre à fibre optique) d'être contrôlé à partir de deux emplacements. Cela a très bien fonctionné. Sur de plus longues distances, un véritable Ethernet fonctionnerait, ou mieux encore tout faire sur fibre et opto-isoler en même temps. Les communications avec la machine réelle peuvent être un problème
Chris H
2
Tibbo fabrique des périphériques de pont "RS232 sur TCP / IP". Ils sont un peu gênants, mais il existe des réseaux de contrôleurs des feux de circulation à l'échelle de la ville qui en dépendent; «centre de commande» exécutant un pont logiciel (des dizaines de ports RS232 virtuels sur un PC) et les contrôleurs dans toute la ville, connectés à la fibre, contrôlés via les petits boîtiers de pont. Approche terriblement archaïque, si vous me demandez, mais fonctionne, et ce ne sont pas des cas hermétiques. Donc, si la machine est contrôlée via RS232 / 485, vous pouvez utiliser ce type d'appareil.
SF.
3

La durée de vie estimée est donnée par le fabricant généralement comme "MTBF = 2000hrs" mais dans des "conditions normales" - ce que vous décrivez n'est pas normal.

Pourquoi les disques SSD échouent - dommages physiques ou mauvaises connexions.

Un support antichoc utilisé dans le passé était un bain de mercure, mais vous ne serez probablement pas autorisé à cela !! Mais vous pourriez faire une version à bain d'huile ...

Solar Mike
la source
Je pensais que c'était parce que le choc provoqué par la tâche était assez dur, donc le montage anti-choc ordinaire n'aidera pas. Comment faire la version bain d'huile? Croyez-moi, lorsque je google un bain d'huile anti-choc, Google me fournit une image idiote. Maintenant, je suis stupide.
adadion
Un plateau rectangulaire contenant l'huile (d'une profondeur suffisante) et un plus petit plateau flottant sur la surface contenant le lecteur de disque - ont une boucle dans le câble pour absorber le mouvement. Petits ressorts souples pour empêcher le plateau flottant de toucher les côtés - les ressorts stylo ou biro peuvent être bons. Choisissez l'huile pour qu'elle ne soit pas trop visqueuse.
Solar Mike
1
Pour la deuxième version, vous pouvez envisager un couvercle ... bonne chance
Solar Mike
1
@adadion Si vous n'avez pas de capteur / mètre de vibration, certaines applications de smartphone vous donneront une idée - la précision peut être un problème mais peut être suffisante pour la comparaison.
Solar Mike
1
@adadion: Si vous êtes prêt à expérimenter, vous pouvez essayer quelque chose comme cette configuration de montage anti-vibration de disque dur bricolage . Il est conçu pour empêcher les vibrations du lecteur lui-même d'atteindre le boîtier, mais il devrait fonctionner aussi bien dans les deux sens. Bien sûr, cela peut ne pas aider beaucoup contre les chocs de haute amplitude et de basse fréquence (comme ce que vous pourriez rencontrer en conduisant rapidement sur une route cahoteuse) qui pourraient faire heurter le lecteur contre le support de montage, mais si vous rencontrez beaucoup de ceux-ci , vous avez de plus gros problèmes de toute façon.
Ilmari Karonen
3

Vraiment un commentaire mais trop long:

J'ai eu affaire à des PC en usine (travail du bois), ils se sont montrés assez résistants.

Notre configuration initiale qui était fondamentalement sans problème: nous avons monté les PC à l'intérieur d'une armoire, la façade était en lattes de plastique transparent (pensez à ce que vous voyez parfois sur un réfrigérateur-congélateur de plain-pied). L'intention initiale était de maintenir une légère pression positive avec de l'air propre, mais cela n'a jamais été fait et s'est avéré inutile.

Malheureusement, après cela, de nombreuses machines ont été installées avec moins de soin. Le mode habituel de «défaillance» était l'arrêt thermique, retirez le couvercle et le soufflez, cela fonctionnerait bien, bien que ceux-ci se soient révélés plus problématiques car la poussière a fait des dégâts.

Les principaux problèmes, cependant, provenaient de leurs fils. Nous avons spéculé des câbles blindés mais la direction nous a coûté cher, le bâtiment a été câblé avec un fil de réseau ordinaire et des modifications ultérieures ont souvent été apportées par des électriciens plutôt que par des informaticiens. Cela a provoqué de nombreuses interférences et était probablement responsable du taux de défaillance élevé des cartes réseau. (Vraiment, maintenant, un Cat-5 jeté sur un 480V, 400? Un bus d'alimentation principal ??? Ou encore plus extrême, une connexion Y dans un chat 5 - qui a effectivement fonctionné, mais avec des problèmes d'erreur de réseau!) t mettre un ordinateur sur le même circuit qu'un moteur lourd. Ne faites pas passer des câbles d'ordinateur parallèlement à des câbles d'alimentation lourds même s'ils sont sur des circuits séparés.

Les machines initiales étaient toutes sans disque (pas une option ces jours-ci) et même après cela, tout ce qui était important était stocké sur le réseau, donc si une machine fonctionnait, elle pouvait être remplacée très rapidement - il fallait plus de temps pour transporter la nouvelle machine vers la station que de la mettre en service à la place de la problématique.

Leçon principale - ne laissez pas les électriciens être des assistants soigneusement surveillés lors du câblage.

Loren Pechtel
la source
2

Nous supposons que le problème est causé par des chocs ou des vibrations. Il peut y avoir plusieurs autres causes, telles que la température, l'humidité, la corrosion, les produits chimiques, comme indiqué par d'autres.

Une autre approche consisterait à placer les disques dans un endroit non hostile et à étendre la connexion avec des câbles. Cela peut nécessiter que vos ordinateurs fonctionnent à partir de disques externes.

Si vous ne pouvez pas éloigner les disques externes, vous pouvez toujours les placer dans un coussin (matériau semblable à une éponge) pour éviter les chocs.

Si vous ne parvenez toujours pas à échapper aux vibrations ou aux chocs, essayez de changer vos ordinateurs avec des ordinateurs difficiles. Cela coûtera probablement quelques dollars à votre entreprise, mais c'est probablement mieux que l'arrêt de la production.

Gürkan Çetin
la source
Comme l'OP l'a dit "réduire le tremblement", la plupart semblent avoir supposé que le problème était dû aux vibrations ...
Solar Mike
1
Convenez que la vibration était la principale / grande cause, mais probablement la deuxième cause est maintenant en place. Qui peut être électrique ou autre, comme le suggère Jonathan. Isoler les disques du PC contournerait également cette option car l'alimentation USB est plus calme que la carte principale?
Gürkan Çetin
Ne serait-il pas trop risqué de placer le chemin de sortie de la gare? L'erreur humaine ne pouvait pas être évitée. :(
adadion
1
C'est une question d'ergonomie, et si la source est la station elle-même, et non l'environnement environnant, cette voie peut être la voie à suivre. Pour les erreurs humaines, voulez-vous dire des câbles sur les passerelles? Vous pouvez également envisager de les soulever sans toucher à la machine. Je peux également penser aux disques sans fil, ce qui entraînerait probablement plusieurs autres préoccupations. :)
Gürkan Çetin
2

Comme d'autres l'ont dit, les SSD sont résistants aux vibrations - il n'y a pas de pièces mobiles, contrairement aux disques durs magnétiques.

Ces deux technologies sont cependant vulnérables aux champs électromagnétiques, comme d'autres l'ont également indiqué. Fournir une protection contre cela peut aider.

Cependant, vous ne devez pas non plus ignorer d'autres facteurs.

(Une note rapide: cette liste n'est certainement pas complète. Regardez simplement la portée des autres réponses - des niveaux de tension, à la chaleur, aux logiciels - il y a BEAUCOUP qui peut causer ces problèmes. À moins que vous ne soyez confiant avec l'informatique, vous voudrez peut-être envisager d'embaucher quelqu'un pour comprendre cela, car il pourrait examiner sur place différents facteurs auxquels vous n'avez pas pensé. Cela dit, voici quelques facteurs que vous devriez également prendre en considération.)

  • Il peut y avoir un problème avec le câble, et de telles erreurs peuvent être très subtiles en ce qu'elles apparaissent juste sporadiquement. Testez les disques durs "défectueux" dans un environnement normal sur un PC différent, avec des câbles différents - pour vous assurer qu'ils ont effectivement des dommages physiques.

  • Cela peut aussi être votre mémoire. À moins que vous n'utilisiez de la mémoire ECC, cela peut être difficile à identifier. Si vos bits retournent dans la mémoire et que c'est là que réside votre programme, le système d'exploitation ou ses pilotes, tous les paris sont désactivés. Il pourrait ne rien faire, il pourrait se bloquer ou il pourrait simplement écrire des ordures sur tout votre disque.

  • Ce n'est peut-être pas du tout un problème matériel. Un bogue logiciel peut également corrompre les données. Avoir une pile de pilotes exotiques peut rendre votre système plus vulnérable à la corruption de données.

En fonction de la cause exacte (vous devez d'abord le déterminer!), Nous pouvons recommander des solutions possibles. Il existe de nombreuses solutions - de l'isolement au RAID en passant par les systèmes de fichiers à somme de contrôle tels que ZFS - mais vous devez d'abord déterminer la cause.

Aaa
la source
2

En plus des autres réponses: dans l'environnement que vous mentionnez, il est possible qu'il y ait de la poussière métallique dans l'air. Lorsque cela pénètre dans l'ordinateur, vous pouvez obtenir des shorts électriques. Un boîtier scellé (ou une ventilation avec un filtre à air de haute qualité) peut aider si c'est le cas.

Hobbes
la source