Combien de temps un CPU fonctionnera-t-il 24 heures sur 24, 7 jours sur 7 [dupliquer]

17

J'ai un Ryzen 1700X (obtenu au lancement), fonctionnant sur ma machine Linux principale, avec d'autres composants qui sont à égalité avec lui. Pendant la journée lorsque l'ordinateur est allumé et que je ne l'utilise pas, j'aime exécuter le client BOINC dessus, ce qui maximise les 16 threads du Ryzen à 100% sans qu'un seul ne retombe, et il peut le maintenir pendant des heures . Ma question est, si je devais faire fonctionner l'ordinateur comme ça, en ignorant la facture électrique et la défaillance du bloc d'alimentation (qui n'est pas encore à venir, mon 1050w 80 gold fonctionne très bien), combien de temps puis-je m'attendre à ce que le CPU à courir avant que des dommages importants ne soient causés au silicone. Je ne l'ai pas surjeté, pas même au "AMD garanti + 400M Hz (OC sur Ryzen semble instable), et son refroidi par Corsair Hydro H60, ce qui est acceptable,

Nick Bailuc
la source
8
Génération beaucoup plus ancienne, donc j'en fais un commentaire plutôt qu'une réponse, mais mon oncle a un 286 dans son laboratoire qui a été acheté neuf au milieu des années 80 pour mener une expérience à long terme. Depuis, il contrôle cette expérience (il est géologue, ça ne marche pas) et ne montre aucun signe d'échec.
Joseph Rogers
1
@JosephRogers Quel type d'expérience nécessite une surveillance constante pendant 30 ans?
user137
8
@ user137 L'expérience Pitch drop , par exemple ;-)
flolilo
2
des dommages importants sont causés au silicone Erreur courante ;-) Le silicium e est ce qui est utilisé dans certains implants, kits, etc. Le silicium (non e) est le métal utilisé pour la fabrication des puces.
Bimpelrekkie
2
@WannabeCoder c'est ma supposition basée sur le fait que le POST produit le code d'erreur PEI 0x54, "Erreur d'initialisation de mémoire non spécifiée". La mémoire est bonne (testée dans un autre système), tout comme la carte mère (testée avec un autre CPU), et le CPU produit le même code d'erreur dans un autre système.
Stephen Kitt

Réponses:

18

Un CPU lui-même durera probablement des dizaines d'années.

Le problème avec la fiabilité du système est en fait tous les autres composants du système. Le processeur subira des cycles de chauffage et de refroidissement thermiques à mesure que la charge change et que vous allumez et éteignez le système. Il en va de même pour presque tous les composants de la machine. La puce de silicium du CPU est connectée à des tampons ou des broches sur le CPU par de minuscules morceaux de fil qui seront affectés.

Les disques durs tournent et tournent vers le bas, ce qui entraîne une contrainte mécanique sur les moteurs et une contrainte thermique lorsque le contrôleur de puissance du disque se réchauffe et se refroidit.

Il est peu probable que les dommages au silicium dans le processeur soient de tout type de mode de défaillance, les tensions sont faibles et les chemins sont bien conçus. Ce n'est que dans les dispositifs de mémoire flash NAND que vous êtes susceptible de voir une défaillance due à une panne d'isolation en silicium, mais c'est parce qu'ils sont intentionnellement entraînés pour provoquer une panne non catastrophique (mais cela sera finalement catastrophique).

Vous êtes plus susceptible de voir des problèmes dus à des contraintes thermiques ou mécaniques, car les températures changent et les composants se déplacent très légèrement, que vous ne voyez de défaillance dans le silicium du processeur réel.

Mokubai
la source
2
Puisqu'il fonctionne à 100% de charge, la dilatation thermique est moins un problème pour lui.
PlasmaHH
@PlasmaHH Alors que le CPU peut fonctionner à 100%, d'autres composants peuvent ne pas l'être. Il ne peut y avoir qu'une charge rare ou intermittente sur les disques durs ou autres périphériques. Je mentionne que le CPU durera probablement longtemps, mais essayait de faire comprendre que c'est en fait le reste du système qu'il est susceptible de mourir plus tôt.
Mokubai
22

Les pannes de processeur provenant d'une utilisation ordinaire sont très rares. Les fabricants fournissent généralement le chiffre par défaut «ça ne va pas échouer» de 100 000 heures, soit un peu plus de dix ans. Mais très probablement, il continuera de fonctionner jusqu'à ce qu'il soit technologiquement obsolète.

David Schwartz
la source
12

La défaillance thermique est le seul mode que j'ai vu personnellement pour un CPU (par opposition à l'équipement de support). La dernière fois que j'ai vu (ou entendu) cela, c'était avec un vieil ordinateur portable Pentium III qui a pris feu (littéralement) un matin.

La gestion thermique est maintenant une opération beaucoup plus sophistiquée dans les systèmes et les CPU ne sont donc pas autorisés à fonctionner trop chaud. En règle générale, un processeur étrangle son horloge pour réduire la température si nécessaire, et l'ensemble du système peut s'arrêter s'il détecte une température trop élevée.

Je pense donc qu'avec l'échec des processeurs modernes (avant l'obsolescence) ce n'est pas un vrai problème.

Les pannes de la carte mère semblent plus courantes (mais toujours relativement peu fréquentes) que les pannes du processeur. La défaillance du lecteur est courante sous forme de saleté, en particulier dans les paramètres de serveur lourds. Je ne penserais plus au CPU.

StephenG
la source
L'ordinateur portable a pris feu? Quelle quantité de poussière s'est accumulée à l'intérieur de cette chose pour que la chaleur du processeur le rallume? Est-ce une occurrence courante avec les processeurs Intel? s'inquiète du portable Acer de 5 ans et plus
MoonRunestar
1
Ce système particulier avait un point chaud (très) tout le temps que je l'avais - un défaut de conception, je pense. Je ne pense pas que ce soit de la poussière qui a pris feu, mais probablement du gaz ou de la vapeur libérée par le matériau surchauffé. C'était il y a une quinzaine d'années. Je ne m'inquiéterais pas du tout d'un ordinateur portable moderne. Intel et AMD ont introduit la technologie de limitation de vitesse en 2005 et 2003, et la conception thermique des ordinateurs portables a beaucoup avancé.
StephenG
3

Les processeurs échouent généralement en raison d'une surchauffe ou d'un problème d'alimentation (course). Le seul problème que je vois avec le processeur en marche depuis des années est que le dissipateur thermique se remplit de saleté et de bouchage. et ne pourra pas le refroidir correctement. Tant que vous gardez le dissipateur de chaleur dans de bonnes conditions de travail, le processeur ira bien.

AsenM
la source
2
ou une certaine puissance (AVC) problème En effet, comme ingénieur électronicien , je vois le bloc d' alimentation comme point de défaillance plus importante ( par rapport à la CPU) que les composants du bloc d' alimentation sont généralement sous plus de stress que la CPU et la carte mère. Egalement entièrement d'accord avec le nettoyage régulier s'il n'est pas dans un environnement sans poussière.
Bimpelrekkie
3

Au cours des 14 années de montage et de vente de PC industriels, j'ai vu un ou deux processeurs morts (sur des milliers vendus). Mais, tout autour du CPU peut être une histoire différente.

Le radiateur est généralement la partie où les fabricants d'ordinateurs trichent souvent - et il est difficile de distinguer la négligence d'une obsolescence planifiée. Avec un thermocouplage bâclé du processeur au dissipateur thermique (en particulier dans les ordinateurs passifs / sans ventilateur), ce n'est pas le processeur qui meurt - ce sont des trucs qui du CPU. Les elyts VRM étaient autrefois un classique, puis il y a eu une période où ils n'étaient pas un problème (lorsque chaque elyt humide en aluminium a été remplacé par un solide-poly comparable), puis les fabricants de cartes / ordinateurs ont pressé et réduit le nombre de solides -poly condensateurs dans le VRM, ou rendu le VRM tout en céramique mais fonctionnant extrêmement chaud, ou certains tels ... Les condensateurs en céramique modernes (MLCC) ne sont plus immortels, et la dépendance de la durée de vie du MLCC sur la tension et la température de fonctionnement grimpent le long de la 2e ou de la 3e puissance (certains disent même plus). Une autre règle de base est que chaque baisse de température de 10 * C signifie deux fois la durée de vie.

Boîtiers BGA combinés à une soudure sans plomb - ce sont des problèmes, en particulier dans les applications où la puce BGA est chaude (le dissipateur thermique est petit ou assez grand mais pas correctement thermocouplé à la puce) et où la température ne cesse de changer de haut en bas .

Mon ancien sens DIY / HAM semble toujours valable: si vous pouvez garder le doigt dessus et qu'il ne sent pas, il a une chance. J'aime les conceptions où les dissipateurs thermiques ne sont que tièdes (et où je sais que la source de chaleur à l'intérieur, généralement le CPU, est bien thermocouplée).

frr
la source