Je vois des processus sur mon SGI Altix 450 exécutant SLES 10.1 cesser de fonctionner (c'est-à-dire ne pas fournir de sortie supplémentaire dans leurs journaux pendant des heures). À ce stade, je veux tuer le processus incriminé afin de pouvoir le redémarrer. Le haut montre que le processus est à l'état (R). Bien que lorsque j'essaye de le tuer, rien ne se passe. Même lorsque j'utilise kill -9, il persiste. Dans ce cas, que puis-je faire d'autre que de redémarrer la machine?
9
Réponses:
Il est possible que le processus soit tué mais attend que le parent recueille sa valeur de retour. Dans ce cas, après sa mort, il se trouverait dans l'état «Z» et non «R». Dans ce cas, vous devriez trouver un
ppid
processus utilisant laps
commande et tuer également le processus parent (si vous êtes vraiment sûr que cela ne causera aucun problème).L'autre cas pourrait être que, pour une raison quelconque, le processus redémarre après avoir été tué comme tty. Dans ce cas, l'ID du processus doit changer à chaque fois que vous tuez -9. Vérifiez si l'ID de processus change à chaque fois que vous essayez de le tuer.
la source
Le processus attend une ressource système, peut-être NFS? cela ne lui permet pas de «lâcher prise». J'adorerais entendre des solutions à ce problème au-delà du mien ...
redémarrez la boîte ou laissez le processus s'asseoir.
Je me demande si vous pourriez «arrêter» le processus via kill -STOP {PID} pour l'empêcher de consommer plus de CPU.
Le redémarrage devrait être possible même avec un autre processus arrêté, mais il peut nécessiter un port de liste ou un segment de mémoire partagée qui est toujours utilisé par l'autre processus.
la source
ls
commande sur un montage s3fs. Lels
processus ne tuera pas même aveckill -9
jusqu'à ce que je force le démontage avecumount -l
Avez-vous déjà vérifié dmesg? J'ai vu cela après une panique du noyau; la seule façon de récupérer est de redémarrer (de préférence bientôt) - puis d'obtenir un noyau corrigé.
Les processus normaux non éliminables seront dans l'état D, pas R.
la source