Comment puis-je voir les journaux sur un serveur après un blocage de panique du noyau?

10

J'exécute une machine Linux de production gentoo, et récemment il y a eu une situation où le serveur s'est bloqué dans mes locaux co-localisés et quand je suis arrivé, j'ai remarqué que le serveur était bloqué sur ce qui semblait être un blocage de panique du noyau. J'ai redémarré la machine avec un redémarrage dur et j'ai été déçu de découvrir que je ne pouvais trouver la moindre preuve de pourquoi la machine se bloquait.

Est-il vrai que lorsque je fais un redémarrage dur, les messages eux-mêmes seront perdus ou y a-t-il un paramètre que je peux faire quelque part dans syslog-ng ou peut-être dans sysctl pour au moins conserver le journal des erreurs afin que je puisse empêcher de tels incidents de se produire A l'avenir ? Soit dit en passant, j'utilise un noyau 2.6.x.

Merci d'avance.

Low Kian Seong
la source

Réponses:

5

Pour journaliser une panique du noyau, utiliser netconsole est beaucoup plus facile que d'utiliser une liaison série;)

Il y a une entrée utile à ce sujet sur le wiki ubuntu qui peut être utilisée sur d'autres versions de Linux ... M'a aidé par exemple avec archlinux.

Notez que netconsole peut également être configuré au démarrage.

Vincent
la source
4

Généralement, dans ces situations, j'ai configuré une console série distante , puis je me suis assuré de consigner tout ce qui apparaît sur la console. Vous pouvez le faire en connectant le port série de la machine à une autre machine via un câble rs-232. Cela peut devenir un peu plus compliqué ces jours-ci, car les ports série disparaissent progressivement, mais je pense que la plupart des serveurs en ont encore.

Ensuite, sur cette autre machine, exécutez conserver et configurez la journalisation de la console. Cela fournit un bon moyen à la fois de tout enregistrer sur la console et de fournir un autre chemin de connexion au système.

Si vous ne souhaitez pas configurer et administrer une autre boîte Linux, une alternative consiste à installer un serveur de console série. Diverses sociétés telles qu'Avocent, Cyclades et Raritan fabriquent ces boîtiers qui fournissent une interface réseau à 2 à 48 ports série. Cependant, ce genre de chose sera plus cher que la simple configuration d'une autre boîte Linux, bien sûr.

Phil Hollenback
la source
4
En plus de la réponse de Phil, notez que de nombreux systèmes NIX (la plupart?) * Videront le noyau / RAM sur la partition de swap en cas de panique, et copieront le vidage sur /var/crashou /var/adm/crashlors du redémarrage pour vous permettre de l'attaquer avec un débogueur et voir où la panique a eu lieu. La console série reste cependant une excellente option, car elle vous permet de voir quelle était la dernière chose que le serveur a fait avant panic()ing.
voretaq7
0

Vous pouvez essayer de répliquer les messages syslog sur une autre machine. Peut-être pas tous, mais seulement des alertes et des mises en cache critiques et désactivantes pour eux.

dtoubelis
la source