Quelles sont les causes courantes de défaillance du processeur?

12

Quelles sont les causes les plus courantes de défaillance du processeur?

Existe-t-il des états intermédiaires entre un processeur fonctionnant parfaitement et un processeur mort?

InquilineKea
la source
1
Les causes courantes incluent la chaleur et des tensions incorrectes. Assurez-vous donc que votre ordinateur est correctement refroidi et que vous disposez d'une bonne alimentation et d'une bonne protection de l'alimentation. Le refroidissement sera médiocre si vos ordinateurs sont trop poussiéreux.
Zoredache

Réponses:

9

Il peut ne nécessiter qu'un seul transistor pour tomber en panne avant qu'un CPU cesse de fonctionner - et comme il y a des millions de transistors dans un CPU moderne, vous pourriez vous demander pourquoi cela ne se produit pas plus souvent.

Et, selon l'emplacement du transistor dans le CPU, l'effet peut être différent, mais je ne pense pas que nous puissions nous attendre à une baisse graduelle des performances: une défaillance de l'ALU peut ne pas être remarquée jusqu'à ce qu'une instruction particulière soit exécutée, et certaines instructions seraient exécutées moins fréquemment.

Les CPUS meurent donc soudainement lorsqu'un transistor tombe en panne. Cela peut être dû à des défauts de la puce informatique trop sollicités, le temps peut donc être un facteur.

Une chaleur excessive peut provoquer la diffusion et la modification des paramètres de fonctionnement des impuretés infimes du silicium qui forment les transistors. La chaleur est une conséquence inévitable du simple fonctionnement des transistors, de sorte qu'un manque de refroidissement peut éventuellement provoquer des pannes.

D'autres raisons peuvent inclure une défaillance des interconnexions dans le boîtier de la puce CPU, mais les fabricants recherchent toujours des méthodes de conditionnement améliorées avec des interconnexions plus fiables et une meilleure dissipation thermique.

pavium
la source
2
La chaleur est de loin le moyen le plus courant. Et vous ne sauriez jamais que cela échouait jusqu'à ce que vous commenciez à obtenir des plantages et des bugs aléatoires. La seule façon de vraiment dire est de déboguer le noyau. Si votre application plante sur des instructions simples et une copie de la mémoire, alors c'est un cadeau mort. Soit ça, soit vous overclockez trop fort :)
surfasb
Je n'appellerais pas les plantages aléatoires et les échecs de bogues. Si le problème disparaît avec le refroidissement - super - mais il semble que l'équipement fonctionnait en dehors de ses spécifications de conception.
pavium le
Mon point est, si vous n'overclockez pas en premier lieu, alors l'alternative est que votre CPU échoue. Et je ne sais pas pour vous, mais si mon ordinateur tombe en panne pendant que le CPU passe de un à zéro, j'appellerais cela un échec. . .
surfasb
Oui, j'étais pédant. Dans l'utilisation courante, l'ordinateur échoue s'il ne peut pas effectuer des opérations de manière fiable. Je devrais également me rappeler que lorsque les gens parlent d'un processeur, ils peuvent ne pas signifier la puce à l'intérieur du gros paquet carré. Je le ferais , mais c'est une perspective professionnelle.
pavium le
Ouais, c'est SuperUser. CPU! = CU.
surfasb
3

Honnêtement, il n'y a pas de cause commune de défaillance du processeur ... au moins par rapport aux autres parties de vos ordinateurs. Le CPU est généralement la partie la plus fiable d'un ordinateur. Ils n'échouent pas souvent.

Au lieu de cela, les choses que vous devez surveiller pour échouer sont celles avec des pièces mobiles: disques durs traditionnels, lecteurs optiques et ventilateurs. Plus récemment, nous devons également ajouter des SSD à cette liste, même s'ils n'ont pas de pièces mobiles. Les condensateurs ont également une durée de vie limitée, et les blocs d'alimentation et les cartes mères, qui utilisent tous les deux des condensateurs, peuvent donc être suspects. Parfois, vous aurez également un mauvais bâton de RAM, mais je ne suis jamais vraiment sûr qu'ils vont mal.

Et maintenant, enfin, seulement après avoir regardé presque tout le reste dans un ordinateur, nous arrivons au CPU. Même lorsqu'une panne se produit, c'est généralement parce que le ventilateur de refroidissement (pièces mobiles à nouveau) s'est mal tourné en premier et que le processeur a surchauffé en conséquence.

Joel Coehoorn
la source
1

Parmi les autres causes mentionnées ici, il peut également y avoir une connexion interne rompue. Plusieurs techniques différentes sont utilisées pour lier les fils internes de la "puce" aux fils externes du boîtier, et tous ceux-ci sont susceptibles de tomber en panne.

Ce type de défaillance pourrait être le résultat d'une surchauffe, et la probabilité de la défaillance augmente avec les "cycles thermiques", même en l'absence de surchauffe. L'échec peut commencer par intermittence (bien que cela se traduise généralement par un crash brutal quand il se produit), mais devenir de plus en plus persistant au fur et à mesure que le système est cyclé.

Ce type d'échec imite les échecs observés à partir de mauvaises connexions paquet / socket, etc.

[Ajouté:] Et je remarque que les "moustaches" n'ont pas été mentionnées. Un gros problème avec les circuits intégrés et les très petits circuits imprimés est les "moustaches" de métal qui se développent hors du câblage plaqué et se court entre les "fils" adjacents. Cela est particulièrement problématique lorsque vous retirez tout le plomb (voir «RoHS»), car du plomb est généralement ajouté aux alliages de fil pour empêcher le grillage. Bien entendu, ce problème s'aggrave avec l'augmentation de la température.

Daniel R Hicks
la source
1

D'après mon expérience, la chaleur. Comment Pourquoi? Trop de pâte thermique! Beaucoup (la plupart?) Savent qu'ils ont besoin de pâte thermique, mais ils ne réalisent peut-être pas le peu qu'ils devraient utiliser.

La règle est d'utiliser autant que la taille d'un grain de riz non cuit, croyez-le ou non.

Bien que la pâte soit environ 10 fois meilleure que l'air à la chaleur conductrice, le cuivre du dissipateur thermique est 10 fois meilleur que la pâte, vous devez donc la rapprocher le plus possible du CPU. La pâte est vraiment uniquement pour remplir les fissures TRÈS PETITES afin que l'air n'y soit pas.

statique
la source
0

Un article intéressant sur le sujet de «Transistor Aging» est paru dans le magazine Spectrum de l'IEEE ( http://spectrum.ieee.org/semiconductors/processors/transistor-aging ). Il énumère plusieurs mécanismes de base qui peuvent conduire à la défaillance d'un transistor individuel, ce qui peut en effet réduire la puissance de calcul de la puce entière à celle d'une pomme de terre (ou d'une brique).

eMPee584
la source