Sur un serveur à deux processeurs, est-il normal qu'un processeur soit plus chaud que l'autre?

51

J'ai un double serveur Opteron sous Linux avec libvirt pour héberger plusieurs ordinateurs virtuels. Les ordinateurs virtuels fonctionnent correctement et le serveur fonctionne correctement, mais je remarque qu'un processeur fonctionne toujours à environ 69 ° C (la régulation à 70 ° C) et l’autre à environ 15 ° C.

Cela ne me semble pas normal? Ne devraient-ils pas être tous les deux un peu plus proches de la température?

Je ne suis pas sûr de savoir comment dianose plus loin. Peut-être qu'il n'y a pas assez de pâte thermique sur l'un des processeurs?

Edit: La carte mère est ASUS KGPE-D16 et refroidie par deux ventilateurs Noctua NH-U9DO .

Notez que je pense que les températures pourraient être inférieures à la température ambiante plutôt qu’à des valeurs absolues. Lorsque le serveur est inactif, la température de la CPU chute à 2C et 13C. J'utilise la configuration de lmsensors à partir d' ici

samoz
la source
1
Quelle est la marque / modèle du serveur?
ewwhite
2
Comment se répartit la charge du processeur? mpstat -P ALL 1sur linux aidera
Christopher Perrin
3
sonne comme un capteur de température cassé
matcheek
14
15C est très probablement un censeur cassé ....
Reaces
Cela ressemble à un capteur cassé ou mal calibré. Si vous pouvez redémarrer le serveur, regardez le BIOS qui devrait afficher les valeurs correctes.

Réponses:

106

Le problème a fini par être un dissipateur thermique mal ajusté. Peut-être que mal en forme n'est pas la bonne description. Il s'avère que vous devez mettre de la pâte thermique sur le dissipateur thermique, pas sur le couvercle en plastique recouvrant le dissipateur thermique.

entrez la description de l'image ici

Après avoir retiré le couvercle en plastique, le processeur est agréable et cool, merci à tous!

samoz
la source
51
+1 juste parce que c'est drôle
HBruijn
9
Vous voulez dire que quelqu'un a laissé le couvercle en plastique en place, puis a appliqué de la pâte, puis un dissipateur thermique? Épique.
TomTom
4
Baaaaaahaaaaaahahahaa !!
Craig
8
J'aime la façon dont vous pouvez voir les termes et conditions, la garantie limitée et la politique de retour en arrière-plan. :)
légèreté court avec Monica
6
Si vous vous sentez moins stupide (et ce ne sera pas le cas), j'ai fait la même chose avec ma nouvelle cafetière de bureau. Le café était trop froid pour être bu et je le préparais pour le retour au magasin avant qu'un disque de carton de protection ne soit déposé sur l'élément chauffant :)
Martin James
25

D'après mon expérience, il est normal que des composants associés dans un boîtier fonctionnent à des températures différentes, car le flux d'air n'est pas le même partout. Voici un graphique de la température du disque dur de ma boîte aux lettres. Les disques sont mis en miroir, de sorte que leur charge de travail est presque identique.

graphique de munin montrant les températures du disque dur au cours de la dernière année

Comme vous pouvez le constater, ils se suivent mutuellement, mais ils ne sont pas identiques. ils sont aussi, en moyenne, seulement 6C à part. Que vos capteurs signalent une température absolue ou une température excessive, une différence de 55 ° C sous charge semble très grave. Si vous êtes certain que les données sont correctes, dans la mesure où la différence de repos diminue à 10 ° C, ce qui est le type de différence que je vois en raison du flux d'air, je soupçonne un dissipateur thermique mal ajusté.

MadHatter soutient Monica
la source
1
En utilisant mpstat (de Christopher Perrin, merci!), J'ai confirmé que la charge était répartie de manière relativement homogène. Les choses tournent au ralenti à + 3C et + 20C. Je vais essayer de jouer avec le dissipateur thermique pour voir s'il est lâche. Pensez-vous que cela pourrait être un problème de pâte thermique?
Samoz
C'est très possible (et plus encore après l'avoir fait bouger).
MadHatter soutient Monica
8

Ce n'est pas. Sauf si vous avez des problèmes graves avec le flux d'air. Ou l'un des refroidisseurs est mauvais. La température variera, mais pas autant (70 degrés Celsius).

Étant donné le niveau bas de 15 degrés, je suppose que (a) votre capteur est éteint (vous stockez réellement le serveur dans une pièce aussi froide?).

Je suppose également que l’un des processeurs ne travaille tout simplement pas, pour une raison quelconque.

Les petites différences sont normales. Quelques petits plus gros peuvent être (flux d'air me venant à l'esprit). mais ici nous parlons d'un être FROID.

TomTom
la source
2

Cela peut être soit un refroidissement, soit une charge inégale (étant donné la différence de température, votre situation est probablement une charge inégale). Vous devriez utiliser quelque chose comme prime95 pour charger tous les cœurs uniformément et voir si les températures varient encore. Si ce n'est pas le cas, vous devez équilibrer les ordinateurs virtuels, vérifiez que vos applications sont multithreads et occupées. Cela dépend de votre logiciel et de votre charge de travail individuelle, ce qui dépasse le cadre de la question. Tenez compte du fait qu’il n’ya aucun avantage réel à le faire si vous n’avez pas assez de charge pour alimenter un seul processeur / cœur. En fait, votre VM peut délibérément éviter d’utiliser un second processeur afin de pouvoir passer en mode économie d’énergie sur plusieurs processeurs. -cpu systèmes.

Si vous l’avez réduite au refroidissement. Une petite différence de jusqu'à 10 ° C pourrait être trop peu (ou trop!) De pâte thermique. Une différence plus importante indique un problème significatif ou une différence entre les refroidisseurs de processeurs. Il se peut que l’on ait bloqué la circulation de l’air, qu’un radiateur se soit détendu, etc.

JamesRyan
la source
0

Je devrais accepter, temp défectueux. capteur, comme 15C est seulement 59F !!! À moins que l'ordinateur ne soit dans un centre de données extrêmement froid, j'imagine que la température de l'air ambiant serait supérieure à 59F! Vous essayez d'affecter les ordinateurs virtuels au noyau basse température et de voir s'il y a un changement. sinon, je soupçonnerais fortement que le capteur soit défectueux.

Vous voudrez peut-être aussi regarder la sortie de dmesg(messages de démarrage) et voir s’il ya quelque chose d’extraordinaire.

J. Simons
la source