Ordinateur portable fonctionnant ~ 30 ° plus chaud que la normale; Le CPU / Load serait normal. Qu'est-ce qui pourrait provoquer cela et comment puis-je le diagnostiquer?

10

J'utilise le dernier Arch Linux sur mon ordinateur portable ThinkPad t420, et j'ai un problème de chaleur intermittente où ma température passera de la normale ~ 45 ° C à ~ 75-90 ° C, et y restera jusqu'à ce que je redémarre.

J'ai couru plusieurs outils de diagnostic, y compris l'évidence htopet d' autres qui googling a suggéré, y compris powertop, iostatset sans doute d' autres , je ne me souviens. Jusqu'à présent, je n'ai trouvé aucun problème évident, et apparemment aucune différence dans les lectures, que ma machine fonctionne normalement ou dans cet état à chaud.

J'ai également tué les processus les plus suspects un par un (bases de données et autres démons), en espérant trouver le coupable caché, en vain.

Au-delà de ces tentatives, je ne sais pas par où commencer le dépannage . J'espère que quelqu'un pourrait m'orienter dans la bonne direction pour commencer à chercher le problème plus profond.

Pour être précis, ma question n'est pas de savoir comment refroidir ma machine, mais plutôt ce qui pourrait provoquer un changement de chaleur constant de 30 degrés dans un système où (apparemment) le CPU et la charge sont normaux? Et quels outils / pratiques pourrais-je utiliser pour le diagnostiquer?

Quelques notes qui pourraient être utiles:

  • Je peux refroidir le système (par exemple en désengageant complètement la commande du ventilateur), mais il se réchauffe immédiatement s'il est laissé seul. Cela semble suggérer que la rétention de chaleur n'est pas un problème, mais plutôt que quelque chose génère continuellement de la chaleur.
  • L'utilisation et la charge du processeur sont signalées htopcomme normales après l'entrée dans cet état chaud. Cela inclut les threads du noyau. Selon htop, le système est essentiellement inactif (1-2% d'utilisation du processeur à l'échelle du système, une charge de 0,10).
  • Ma machine utilise des graphiques intégrés Intel HD et n'a pas d'autre carte graphique . Une carte nVidia était une option pour ce modèle, comme l'a noté @braiam; Je n'ai pas opté pour ça.
  • @terdon a fait apparaître les paramètres du gouverneur de CPU. Mes processeurs sont définis surpowersave
  • Mon processeur spécifique est un Core i7-2620M à 2,7 GHz.

Edit : au moment de la rédaction de cette question, mon fancontrol ne fonctionnait pas correctement et fonctionnait continuellement à un régime moyen (3900 tr / min), même à des températures élevées. À la suggestion de @Alex et @JustDanyul, cela a été corrigé. Le problème sous-jacent demeure cependant.

numéros1311407
la source
1
Comme l'indique slm, si le CPU est inactif mais que la température centrale est trop élevée, la seule explication possible est que la chaleur excessive n'a pas été dissipée après un certain événement - la seule chose qui peut produire une chaleur importante est le CPU. Pensez à allumer un brûleur du poêle pour faire bouillir de l'eau, puis à y mettre un couvercle et à baisser le brûleur à bas: l'eau reste bouillante perpétuellement parce que la chaleur ne peut pas se dissiper aussi vite que le brûleur bas le remplace aussi longtemps que le couvercle est allumé . Démontez-le et nettoyez-le s'il est si mauvais, le simple fait de souffler de l'air n'aidera pas beaucoup à ce stade.
goldilocks
Je vais certainement le démonter et le nettoyer car je soupçonne que j'ai des problèmes de débit d'air, mais comme il s'agit du CPU, il maintiendra une température élevée constante indéfiniment après quel que soit l'événement qui cause le changement de température extrême. Même si vous laissez le couvercle sur le pot, la température de l'eau baissera à un moment donné. Ma température atteint un certain nombre et reste simplement là, toujours à ce nombre, pour toujours jusqu'à ce que je redémarre. Il n'y a pas de construction progressive de chaleur qui suggère qu'il a des problèmes de dissipation. J'ai couru sous une charge de travail complète toute la matinée et je suis assis à 41 degrés.
numéros1311407
En d'autres termes, ma température se régulera normalement sous le stress attendu. Si je fais une compilation difficile, cela peut chauffer jusqu'à 60, 70 degrés, mais quand cela sera fait, il refroidira.
numéros1311407
Outre le ventilateur, vous pouvez réappliquer la pâte thermique. Une pâte thermique moins chère se dissipera avec le temps.
BlueRaja - Danny Pflughoeft
1
C'est peut-être une question stupide, mais avez-vous par hasard désactivé l'ACPI? J'ai eu des problèmes similaires il y a quelque temps avec un ancien PC, qui ne démarrait pas avec cette option activée, après l'avoir désactivée, il a finalement démarré, mais était également en surchauffe.
Alko

Réponses:

6

Le fan

Le mien fait aussi cela, en exécutant Fedora 14. Essayez d'obtenir une canette d'air comprimé et de souffler les évents à l'arrière et sur le côté du boîtier.

Vous souhaiterez également périodiquement retirer le clavier et souffler de l'air comprimé directement sur les pales du ventilateur. Ils sont recouverts de poussière et commencent à affecter son efficacité en l'alourdissant.

La meilleure chose à propos des Thinkpad est les manuels de service! Ils vous montrent comment démonter votre ordinateur portable et le remonter.

Mauvais processus

L'autre chose que j'ai remarquée, c'est que je vais parfois avoir un processus qui a mal tourné et qui consomme 100% de l'un des cœurs. Tuer ce processus ramène généralement la température à la normale.

Vous pouvez utiliser htopou toppour voir de quel processus il s'agit et le tuer depuis leur terminal ou depuis un terminal qui l'utilise PID.

quoi d'autre?

Voir ma réponse à cette Q&R U&L pour plus de conseils sur la façon d'obtenir des lectures de température pour les différents composants de votre ordinateur portable. Le Q&R est intitulé: Comment obtenir la température à cœur des cœurs haswell i7 dans i3status .

slm
la source
C'est certainement quelque chose que je devrais faire, mais ce qui est étrange pour moi, c'est pourquoi il ne passe parfois à l' état chaud et persiste jusqu'au redémarrage, ce qui résout immédiatement le problème. Il semble que quelque chose doit se produire qui déclenche le changement persistant de chaleur. J'ai couru htop en vain. L'utilisation du processeur est normale.
numéros1311407
Peut-être que certains signaux de réveil avec le noyau?
Braiam
1
@slm merci, je n'ai pas essayé ça. Je le ferai la prochaine fois qu'il commencera à fonctionner à chaud et rapportera les résultats.
numéros1311407
1
@ numbers1311407: La raison pour laquelle le redémarrage résout le problème rapidement est que cela éteint le processeur pendant quelques secondes, ce qui permet à la température de descendre en dessous du point de coupure. Le CPU est toujours plus chaud que la température ambiante, quelle que soit la "température ambiante".
goldilocks
1
Veuillez noter que dans la topcommande, vous pouvez appuyer sur "1" pour voir la charge des cœurs individuels.
Christian Stewart
3

C'est plus un long commentaire, mais vous devriez jeter un œil à thinkwiki.org, c'est la ressource pour Linux sur les ThinkPads. Quant à la température, j'ai eu des problèmes similaires avec mon t4500 et je l'ai réglé en jouant avec

  1. Le gouverneur CPU qui contrôle la mise à l'échelle de la fréquence CPU. Vos choix sont:

    • Les performances maintiennent le processeur à la fréquence la plus élevée possible
    • Powersave maintient le CPU à la fréquence la plus basse possible
    • L'espace utilisateur exporte les informations de fréquence disponibles au niveau utilisateur (via le système de fichiers / sys) et permet le contrôle de la fréquence du processeur dans l'espace utilisateur
    • Ondemand met à l' échelle les fréquences du processeur en fonction de l'utilisation du processeur (comme le font les démons de mise à l'échelle des fréquences de l'espace utilisateur, mais dans le noyau)
    • Les conservateurs agissent comme l'ondemand mais augmentent la fréquence pas à pas

    Avec ondemand , votre CPU ne fonctionnera à sa vitesse la plus élevée que si nécessaire. Idéalement, cela sera totalement transparent pour vous, votre machine travaillera simplement aussi vite que nécessaire pour les tâches en cours. Pour l'activer,

    sudo echo ondemand > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
    
  2. Contrôle du ventilateur. Il existe un très bel utilitaire appelé " Simple ThinkPad Fan Control " qui vous permet de régler avec précision les températures de déclenchement qui modifient la vitesse du ventilateur. Consultez également les informations ici .

terdon
la source
Merci, c'est très utile. J'ai déjà rencontré ce wiki mais je n'ai jamais vraiment pris note de ce que c'était exactement.
numéros1311407
Juste pour noter, tous mes processeurs fonctionnentpowersave
numéros1311407
1

Je pense qu'il y a un problème avec ce que vous percevez comme "chaud". Pour le Thinkpad t420 ( selon les forums ), c'est environ 80-85 C et oublions la carte nVidia qui pourrait aussi provoquer une augmentation de la température (en fait la configuration Optimus pourrait ne pas bien fonctionner, forçant votre CPU à faire du GPU). Ce mot, votre maximum CPU température tolérée est 100C (s'il y arrive l'arrêt de la volonté du système), alors que l'ambiance est d' environ 10,0 ° C à 35,0 ° C . Cela dit, si votre ordinateur portable est dans la plage, tout va bien (sauf pour la durée de vie de votre batterie et de votre ordinateur portable).

Maintenant, vous vouliez signaler d'éventuels suspects. Dans cet aspect, je dirais que la mauvaise implémentation de nVidia avec Linux peut jeter du travail sur votre CPU qui ne s'affichera pas dans htop (ou n'importe où) en raison de son infâme système On-Demand Optimus, qui semble correspondre à votre situation actuelle ( ça marche bien jusqu'à un moment, ça commence juste à chauffer sans contrôle). Vous devez mettre à jour votre installation jusqu'à ce que Bumblebee soit entièrement configuré. Vous pouvez utiliser le bbswitchpour dissoudre la carte nVidia à volonté et voir comment cela se passe.

Pour installer Bumblebee for Arch, vous pouvez trouver le package sur le référentiel. Si vous ne l'avez toujours pas installé.

Braiam
la source
Je n'ai pas opté pour la carte nVidia sur cette machine. Désolé, aurait dû être plus clair à ce sujet dans la question. Et bien que 80-85 ne soit pas trop chaud , il fait toujours plus chaud que le milieu des années 40, ce à quoi mon ordinateur fonctionne normalement avec une charge de travail légère typique. Mon problème essaie de déterminer quelle condition fantôme "entre en jeu" et fait que mon 45 constant est un 80-85 constant.
numbers1311407
1

les capteurs montrent que mon ventilateur bourdonne à ~ 3900 tr / min

Même avec des températures comme ~ 75-90 ° C?

comme la montée en puissance manuelle du ventilateur refroidira temporairement la machine

Donc, un problème est juste que la vitesse du ventilateur ne fonctionne pas automatiquement?

Oubliez l'automobile, vous pouvez lire la température correctement et vous pouvez contrôler la vitesse du ventilateur manuellement, non? Si c'est le cas, tout ce que vous devez faire est de trouver un script de contrôle du ventilateur qui fonctionne ou de déployer le vôtre (interrogez la température et réglez la vitesse selon un tableau temp[i]=speed[i], lorsque vous définissez une vitesse plus élevée, gardez-la pendant un certain temps même si la température baisse , lorsque vous devez ralentir, faites-le lentement et pas à pas).

À propos du sondage, le mieux serait d'avoir un démon de surveillance de la température qui déclenche des événements de changement thermique et le script de contrôle du ventilateur écoutant / attendant ces événements, je pensais (peut-être à tort) une fois que c'était le cas acpidmais de nos jours je ne sais pas.

Dans les deux cas (votre propre script / existant), même si vous n'êtes pas sûr de la solution, gardez toujours un œil sur la température et le régime, le ventilateur ne doit pas s'arrêter.

Résolvez d'abord ce autoproblème et si la surchauffe persiste, vous pouvez vous concentrer sur la cause.

Éditer

Vous voudrez peut-être essayer un outil comme lttngcollecter des statistiques de l'ensemble du système au fil du temps, mais il pourrait ne pas être facile à configurer et pourrait être coûteux en termes de stockage si vous devez collecter pendant une longue période.

Alex
la source
Vous avez raison de dire que mon contrôle de fantaisie fonctionne mal, voire pas du tout. Je vais essayer de le faire réagir correctement, mais le réparer ne résoudra pas la cause sous-jacente. Je pourrais laisser la chose lâche à un maximum de 6400 rpms toute la journée et refroidir un peu, mais c'est la cause que j'essaie de résoudre.
numéros1311407
1

Étant donné que la montée en charge manuelle du ventilateur résout le problème, ce serait un excellent endroit pour commencer le dépannage, car cela semble suggérer que la commande automatique du ventilateur ne fonctionne pas.

Maintenant, vous exécutez arch linux, qui est une brillante distribution (oui, je l'exécute aussi) avec un wiki formidable. Donc, je dois demander, avez-vous RTFM? ; p

https://wiki.archlinux.org/index.php/Lenovo_ThinkPad_T420#Fans

Pour autant que je sache, vous devez:

  1. activer le module du noyau thinkpad_acpi
  2. installer et configurer l'application thinkfan à partir de l'AUR
  3. activer le service système thinkfan

Est-ce que tout cela a été fait?

MISE À JOUR Je suis heureux d'apprendre que votre fan fonctionne maintenant correctement, plutôt que de tourner simplement sur un juste milieu. (Je suppose que cela a résolu le problème de votre machine fonctionnant à des températures supérieures à 80 degrés?)

En ce qui concerne la réponse à la cause sous-jacente d'un changement de température de 30 degrés, eh bien, je suis tenté de demander: ne pourrait-il pas être dû au fait que votre ventilateur ne fonctionnait pas correctement?

Permet de postuler que,

  • le processeur ne travaille pas plus fort que la normale
  • les fluctuations de température sont maintenant remplacées par des fluctuations de vitesse du ventilateur

Ne serait-il pas prudent de supposer qu'il pourrait ne pas y avoir de problème du tout et que le problème était simplement que votre ventilateur fonctionnait à un niveau où il faisait à peine face? Et de petits changements de température ambiante, etc., la mettent-ils au-dessus de la limite de ses capacités?

Par exemple, j'avais un ordinateur portable Acer, et par temps chaud, le ventilateur tournait "constamment" de haut en bas. Je parie que si mon ventilateur n'était pas capable de s'ajuster lui-même, j'aurais également vu des fluctuations de température assez importantes :)

JustDanyul
la source
Je viens d'installer thinkfan. Merci pour les informations à ce sujet. Oui, le wiki arch détaillé est un grand avantage de la distribution. J'y suis allé mille fois mais je n'ai jamais trébuché ni pensé à chercher une page dédiée à mon modèle exact, et je n'avais jamais vu thinkfan mentionné. Joli petit script. Cela étant dit, cela ne résout pas mon problème réel: comment puis-je diagnostiquer la cause de ma température inhabituellement élevée? Même si j'ai désengagé le contrôle de fantaisie et coupé la chose à un régime maximal, cela ne fait que mettre un bandaid sur le vrai problème de la chaleur mystérieuse.
numéros1311407
Non, le problème existe toujours inchangé. Je suis assis ici en ce moment à 42 degrés. Lorsque ma condition de chaleur se produira, j'exécuterai les mêmes processus, la température ambiante sera équivalente, rien n'aura apparemment changé, mais ma température passera d'un 42 cohérent à un 75+ cohérent. Je peux le refroidir: le mettre sur un refroidisseur d'ordinateur portable, désengager le fancontrol permettant de tourner à 6500 tr / min, etc. Mais si j'arrête, il chauffera à nouveau jusqu'à 75+. Le ventilateur à vitesse maximale n'est que légèrement plus rapide qu'il ne le faisait de toute façon. Le réparer était une bonne chose, mais pas une solution au problème sous-jacent.
numéros1311407