Comment déboguer les gels fréquents irrécupérables?

9

Mon nouveau XPS 13 (9360 avec processeur KabyLake) avec Ubuntu 16.04 préinstallé se bloque fréquemment complètement sans aucune raison apparente.

Les gels se produisent apparemment au hasard. Parfois, le pointeur de la souris peut encore être déplacé pendant quelques secondes, mais le système se verrouille finalement complètement. Je ne peux pas passer aux terminaux virtuels et même les codes SysRq ne semblent avoir aucun effet. Tout ce que je peux faire est d'appuyer longuement sur le bouton d'alimentation pour une mise hors tension ferme, après quoi le système démarre normalement.

Les processus utilisateur en cours d'exécution sont principalement constitués de plusieurs onglets Chrome et d'un terminal.

Les choses que j'ai vérifiées et essayées incluent:

Après cela, les blocages se produisent toujours. Maintenant, je suis perdu. Ma question est donc:

Quels sont les moyens de trouver la cause du problème?

justfortherec
la source
Cela ressemble à un bogue cstate qui existait avec les processeurs Bay-Trail. Je suppose que ça vaut le coup d'essayer le correctif, aussi. Redémarrez votre machine jusqu'à ce que vous voyiez les gruboptions de démarrage. Cliquez epour afficher les options de ligne de commande. Ensuite, ajoutez intel_idle.max_cstate=1juste après les mots quiet splashet démarrez. Voyez si cela fonctionne. Vous devrez peut-être déposer un bogue dans Launchpad. Quel noyau utilisez-vous?
negusp
@PatrickNegus C'est avec le noyau 4.4.0-47-generic. Il existe une option BIOS pour désactiver les états C. Est-ce que cela fait essentiellement la même chose? Je vais essayer de modifier la ligne de commande. Par «un bug cstate qui existait avec le CPU Bay-Trail», voulez-vous dire un bug du noyau ou un bug matériel? Vaut-il la peine d'essayer de nouveaux noyaux principaux?
justfortherec
Le noyau 4.8 a un support bien meilleur pour Kaby Lake que 4.4. Alors oui, veuillez mettre à niveau. En ce qui concerne le bogue Bay-Trail, c'était et est toujours un bogue du noyau qui empêche Ubuntu de gérer efficacement les états de veille du processeur (ce qui économise de l'énergie pour le processeur et donne une bien meilleure efficacité au ralenti).
negusp
Merci pour votre aide, @PatrickNegus. Juste pour vérifier que nous voulons dire la même chose. Voulez-vous dire la mise à niveau vers le noyau de 16.10 comme décrit dans askubuntu.com/a/840184/63018 ?
justfortherec
Oui, c'est ce que je voulais dire.
negusp

Réponses:

4

Désactivez intel_cstates(les états d'économie d'énergie destinés à réduire la chaleur perdue du processeur et la consommation d'énergie) en modifiant /etc/default/grub:

sudo nano /etc/default/grub

Trouvez la ligne contenant GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"

Ajoutez intel_idle.max_cstate=1directement après splash.

Alternativement, si votre BIOS le prend en charge, désactivez lesdits états C à partir de là.

Remarque: ce n'est pas une solution à long terme. La désactivation des états C augmente considérablement la consommation d'énergie et la chaleur perdue. Essayez ceci seulement s'il n'y a pas d'autres solutions et la mise à jour de votre noyau ne résout rien!

negusp
la source
pourquoi cela aiderait-il exactement?
Korijn
@ Korijn ... cela fait un moment, mais il y a eu (ou peut-être résolu) un bogue avec les processeurs Intel Bay Trail dans lequel il y a une instabilité importante dans le système lorsque les états d'économie d'énergie sont activés. La désactivation des états c corrige le bogue.
negusp
3

Comment installer le noyau 4.8.5

Bien que 4.8.7 soit le dernier noyau, dans ce journal de bogues de 500 articles et de 1 an ( bogue 109051 - intel_idle.max_cstate = 1 requis sur baytrail pour éviter les plantages ), il est signalé qu'il ne fonctionne pas. Pas plus tard qu'hier, quelqu'un a posté qu'il avait essayé la 4.8.7, il s'est écrasé, il est donc revenu à la 4.8.6.

Bien que le titre du journal des bogues soit pour "Bay Trail", les solutions présentées s'appliquent à d'autres plates-formes Intel comme le rapportent les utilisateurs. Puisqu'il y a 582 publications couvrant presque un an, je recommande d'appuyer sur la Endtouche après avoir ouvert le lien et de faire défiler vers le haut à partir de là.

J'ai utilisé 4.8.5 de temps en temps aux côtés de 4.4.0-47 pendant quelques semaines et je me sens à l'aise avec l'un ou l'autre. Voici les instructions pour installer la version 4.8.5 du noyau:

cd /tmp
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.8.5/linux-headers-4.8.5-040805_4.8.5-040805.201610280434_all.deb
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.8.5/linux-headers-4.8.5-040805-generic_4.8.5-040805.201610280434_amd64.deb
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.8.5/linux-image-4.8.5-040805-generic_4.8.5-040805.201610280434_amd64.deb
sudo dpkg -i *.deb
sudo reboot

Vous pouvez installer n'importe quel noyau en visitant le site: ( http://kernel.ubuntu.com/~kernel-ppa/mainline/ ) et en adaptant les liens qui s'y trouvent aux instructions ci-dessus.

WinEunuuchs2Unix
la source
Merci pour l'info. Cependant, je ne l'accepterai pas comme la réponse à ce sujet, car il répond à une question que j'ai soulevée dans le commentaire, pas à la question d'origine de ce fil.
justfortherec
En effet. Faites-moi savoir si vous essayez un nouveau noyau et s'il fonctionne bien.
WinEunuuchs2Unix
2
Mon système s'est arrêté de geler au hasard après la mise à jour vers n'importe quel noyau 4.8 que j'ai essayé (LTS 4.8.0-25.27~16.04.1et mainline 4.8.12-040812.201612020431).
justfortherec