Erreurs matérielles du processeur dans Ubuntu 17.04

12

Quelqu'un peut-il m'expliquer quels sont ces messages d'erreur que j'ai reçus lorsque j'ai regardé dans dmesg? Je suis nouveau sur Ubuntu et sur le monde Linux.

[ 7.802351] CPU4: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802352] CPU0: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802353] CPU5: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU0: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU4: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] CPU1: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] mce: [Hardware Error]: Machine check events logged
[ 7.802362] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802363] mce: [Hardware Error]: TSC 99561677c
[ 7.802385] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.802387] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802387] mce: [Hardware Error]: TSC 995616be4
[ 7.802388] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.802389] CPU2: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802390] CPU6: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802391] CPU3: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802392] CPU7: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.826359] CPU4: Core temperature/speed normal
[ 7.826359] CPU0: Core temperature/speed normal
[ 7.826360] CPU2: Package temperature/speed normal
[ 7.826361] CPU6: Package temperature/speed normal
[ 7.826361] CPU0: Package temperature/speed normal
[ 7.826362] CPU4: Package temperature/speed normal
[ 7.826363] mce: [Hardware Error]: Machine check events logged
[ 7.826367] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826368] mce: [Hardware Error]: TSC 99916f004
[ 7.826369] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.826369] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826370] mce: [Hardware Error]: TSC 99916f2ca
[ 7.826370] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.826400] CPU1: Package temperature/speed normal
[ 7.826401] CPU5: Package temperature/speed normal
[ 7.826402] CPU3: Package temperature/speed normal
[ 7.826402] CPU7: Package temperature/speed normal
[ 467.922330] CPU4: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922331] CPU0: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922332] CPU7: Package temperature above threshold, cpu clock throttled (total events = 86)
[ 467.922333] CPU3: Package temperature above threshold, cpu clock throttled 

J'utilise Ubuntu 17.04 avec un noyau générique 4.10.0-29

M.Voyles
la source
ou c'est un bug logiciel j'ai le même dans mon journal d'un nouveau Lenovo T480S voir bugs.launchpad.net/ubuntu/+source/linux/+bug/1781924
Rolf Schumacher

Réponses:

8

Le CPU est en surchauffe et passe en MCE (événements de vérification de la machine) ... c'est-à-dire qu'il plante. Si vous ne voyez pas d'autres événements liés à la température dans syslog, c'est probablement parce que votre refroidisseur de CPU / ventilateur / tuyau thermique / pâte thermique ne fait pas le travail.

  • Vérifiez syslog avec cette terminalcommande ...

    grep -i -e temp -e therm /var/log/syslog*
    
  • Si la machine est très sale / poussiéreuse, cela pourrait jouer un rôle majeur dans la surchauffe de la machine. Nettoyez-le.

  • Si votre ordinateur intel-microcodeest équipé de processeurs Intel, assurez-vous qu'il est installé.

    sudo apt-get update
    sudo apt-get install intel-microcode
    reboot
    
  • Installez thermaldpour essayer de contrôler la température.

    sudo apt-get update
    sudo apt-get install thermald
    reboot
    
  • Vérifiez votre version du BIOS. Entrez votre BIOS à la mise sous tension et notez la version #. Accédez au site Web du fabricant avec la marque / le modèle de votre ordinateur. Accédez à la section support / téléchargements et recherchez s'il existe un BIOS plus récent.

  • Enfin, et très probablement, s'il s'agit d'une machine plus ancienne, le composé thermique qui se trouve entre les processeurs et son refroidisseur de caloduc / ventilateur doit être appliqué de nouveau. Cela nécessite une certaine expérience technique.

heynnema
la source
1
Quel impact cela a-t- intel-micorocodeil sur la température?
gene_wood
@gene_wood comme je l'ai mentionné, c'est probablement un problème de poussière, de ventilateur ou de composé thermique, et la vérification du microcode n'est qu'une autre étape pour aider à diagnostiquer le problème à distance. L'ancien microcode du processeur peut provoquer divers problèmes. Quelques secondes pour le vérifier.
heynnema