J'ai un processus que je ne peux pas tuer avec kill -9 <pid>
. Quel est le problème dans un tel cas, surtout depuis que je suis le propriétaire de ce processus. Je pensais que rien ne pouvait échapper à cette kill
option.
kill -9
( SIGKILL ) fonctionne toujours, à condition que vous ayez la permission de tuer le processus. Fondamentalement, le processus doit être lancé par vous et ne pas être setuid ou setgid, ou vous devez être root. Il existe une exception: même la racine ne peut pas envoyer de signal fatal au PID 1 (le init
processus).
Cependant, il kill -9
n'est pas garanti de travailler immédiatement . Tous les signaux, y compris SIGKILL, sont livrés de manière asynchrone: le noyau peut prendre son temps pour les transmettre. Généralement, l'envoi d'un signal prend au plus quelques microsecondes, le temps nécessaire à la cible pour obtenir une tranche de temps. Cependant, si la cible a bloqué le signal , le signal sera mis en file d'attente jusqu'à ce que la cible le débloque.
Normalement, les processus ne peuvent pas bloquer SIGKILL. Mais le code du noyau peut, et les processus l'exécutent lorsqu'ils appellent des appels système . Le code du noyau bloque tous les signaux lorsque l'interruption de l'appel système entraînerait la violation d'une structure de données mal formée quelque part dans le noyau, ou plus généralement de certains invariants du noyau. Donc, si (en raison d'un bogue ou d'une conception incorrecte) un appel système bloque indéfiniment, il peut en réalité être impossible de tuer le processus. (Mais le processus sera tué s'il termine jamais l'appel système.)
Un processus bloqué dans un appel système est en veille ininterrompue . La commande ps
ou top
(sur la plupart des unités) l'affichera dans l'état D
(à l'origine pour “ d isk”, je pense).
Un cas classique de mise en veille prolongée et ininterruptible concerne les processus accédant à des fichiers via NFS lorsque le serveur ne répond pas. les implémentations modernes ont tendance à ne pas imposer de veille ininterrompue (par exemple, sous Linux, l' intr
option de montage permet à un signal d'interrompre les accès aux fichiers NFS).
Vous pouvez parfois voir des entrées marquées Z
(ou H
sous Linux, je ne sais pas quelle est la distinction) dans la sortie ps
ou top
. Ce ne sont techniquement pas des processus, ce sont des processus zombies, qui ne sont rien de plus qu'une entrée dans la table des processus, conservés afin que le processus parent puisse être averti du décès de son enfant. Ils disparaîtront lorsque le processus parent fera attention (ou mourra).
man 5 nfs
: "L' optionintr
/nointr
mount est obsolète après la version 2.6.25 du noyau. Seul SIGKILL peut interrompre une opération NFS en attente sur ces noyaux. Si elle est spécifiée, cette option de montage est ignorée afin de fournir une compatibilité ascendante avec les noyaux plus anciens."sshfs
processus (et de même avec tout autre système de fichiers FUSE: vous pouvez toujours forcer le démontage de cette façon).Parfois, le processus existe et ne peut pas être tué en raison de:
top
elle est signalée Ztop
il est signalé par D.la source
Il semble que vous ayez un processus zombie . C'est inoffensif: la seule ressource qu'un processus zombie consomme est une entrée dans la table des processus. Il disparaîtra lorsque le processus parent décédera ou réagira à la mort de son enfant.
Vous pouvez voir si le processus est un zombie en utilisant
top
ou la commande suivante:la source
ps
. Qui peut être sûr que le champ requis sera toujours le 8ème, avec toutes les implémentations deps
dans tous les Unices?Vérifiez votre
/var/log/kern.log
et/var/log/dmesg
(ou équivalents) pour des indices. D'après mon expérience, cela ne m'est arrivé que lorsque la connexion réseau d'un montage NFS a été soudainement interrompue ou qu'un pilote de périphérique est tombé en panne. Cela pourrait arriver si un disque dur tombe en panne, je crois.Vous pouvez utiliser
lsof
pour voir les fichiers de périphérique ouverts par le processus.la source
kill -9
généralement ne fonctionnait pas, même après une attente de 60 minutes. La seule solution était de redémarrer.Si les réponses de @ Maciej et de Gilles ne résolvent pas votre problème, et vous ne reconnaissez pas le processus (et demander ce que c'est avec votre distribution ne fournit pas de réponses). Vérifiez les rootkits et tout autre signe que vous avez été possédé . Un rootkit est plus que capable de vous empêcher de tuer le processus. En fait, beaucoup sont capables de vous empêcher de les voir. Mais s'ils oublient de modifier 1 petit programme, ils peuvent être repérés (par exemple, ils ont modifié
top
, mais pashtop
). Très probablement, ce n'est pas le cas, mais mieux vaut prévenir que guérir.la source
Tuer signifie en réalité envoyer un signal. vous pouvez envoyer plusieurs signaux. kill -9 est un signal spécial.
Lors de l'envoi d'un signal, l'application en traite. sinon le noyau s'en occupe. afin que vous puissiez intercepter un signal dans votre application.
Mais j'ai dit que tuer -9 était spécial. C'est spécial en ce que l'application ne l'obtient pas. il va directement au noyau qui tue réellement l'application à la première occasion possible. en d'autres termes le tue mort
kill -15 envoie le signal SIGTERM qui signifie SIGNAL TERMINATE, autrement dit indique à l'application de quitter. C’est le moyen convivial de dire à une application qu’il est temps de s’arrêter. mais si l'application ne répond pas, kill -9 le tuera.
Si kill -9 ne fonctionne pas, cela signifie probablement que votre noyau est hors d’usage. un redémarrage est en ordre. Je ne me souviens pas de cela.
la source
Tout d’abord, vérifiez s’il s’agit d’un processus Zombie (ce qui est très possible):
Vous verrez quelque chose comme:
(Notez le "Z" à gauche)
Si la 5ème colonne n'est pas 1, cela signifie qu'il a un processus parent. Essayez de tuer cet identifiant de processus parent .
Si son PPID = 1, NE LE TUEZ PAS !! , pensez aux autres dispositifs ou processus susceptibles d’être liés à celui-ci.
Par exemple, si vous utilisiez un périphérique monté ou Samba, essayez de le démonter. Cela peut libérer le processus Zombie.
REMARQUE : Si
ps -Al
(outop
) affiche un "D" au lieu de "Z", cela peut être lié au montage distant (comme NFS). D'après mon expérience, le redémarrage est le seul moyen d'y arriver, mais vous pouvez vérifier les autres réponses qui couvrent ce cas plus en détail.la source
Le processus init est immunisé contre SIGKILL.
Ceci est également vrai pour les threads du noyau, c'est-à-dire les "processus" avec un PPID égal à 0.
la source
Comme d'autres l'ont mentionné, un processus en sommeil ininterruptible ne peut pas être tué immédiatement (ou même dans certains cas). Il est à noter qu'un autre état de processus, TASK_KILLABLE, a été ajouté pour résoudre ce problème dans certains scénarios, notamment dans le cas habituel où le processus attend NFS. Voir http://lwn.net/Articles/288056/
Malheureusement, je ne crois pas que cela soit utilisé nulle part dans le noyau, sauf NFS.
la source
ls
processus accédant à unsshfs
montage, lorsque le serveur distant est devenu inaccessible. Existe-t-il une solution pour FUSE ou sshfs, que je pourrais utiliser à l'avenir pour éviter de telles situations? 2.6.30 noyauFait un petit script qui m'a beaucoup aidé à regarder!
Vous pouvez l'utiliser pour tuer n'importe quel processus avec un nom donné dans son chemin (faites attention à ceci !!) ou vous pouvez tuer n'importe quel processus d'un utilisateur donné en utilisant le paramètre "-u nom d'utilisateur".
la source
Il y a des cas où même si vous envoyez un kill -9 à un processus, ce pid s'arrête, mais le processus redémarre automatiquement (par exemple, si vous l'essayez avec
gnome-panel
, il redémarrera): cela pourrait-il être le cas ici?la source
d' ici à l'origine :
vérifier si strace montre quelque chose
essayez de vous connecter au processus avec gdb
si le processus interagissait avec un périphérique que vous pouvez démonter, supprimez le module du noyau pour ou déconnectez / déconnectez physiquement ... puis essayez-le.
la source
J'ai eu genre de ce problème. C'était un programme que j'avais lancé
strace
et interrompu avecCtrl
+C
. Il s'est retrouvé dans un étatT
(tracé ou arrêté). Je ne sais pas comment c'est arrivé exactement, mais ce n'était pas meurtrier avecSIGKILL
.Longue histoire courte, j'ai réussi à le tuer avec
gdb
:la source
D'après un indice tiré de la réponse de Gilles, j'ai eu un processus marqué "Z"
<defunct>
qui utilisait les ressources système, il avait même un port ouvert qui était LISTEN'ing et vous pouviez vous connecter à ce port. C'était après avoir exécuté unkill -9
dessus. Son parent était "1" (c'est-à-direinit
) donc théoriquement, il devrait juste être répété et disparaître. Mais ce ne l'était pas, il restait dans les parages, mais ne courait pas, et "ne mourait pas"Donc, dans mon cas, c’était un zombie mais qui consommait toujours des ressources ... FWIW.
Et il n'a pas été killable par un certain nombre de
kill -9
« sEt son parent était
init
mais il n'a pas été récolté (nettoyé). Ie ainit
eu un enfant de zombie.Et le redémarrage n'était pas nécessaire pour résoudre le problème. Même si un redémarrage "aurait fonctionné" autour du problème / l’arrêt plus rapide. Juste pas gracieux, ce qui était encore possible.
Et c’était un port LISTEN appartenant à un processus zombie (et quelques autres ports comme le statut CLOSE_WAIT connecté localhost à localhost). Et il a même encore accepté les connexions. Même comme un zombie. J'imagine que les ports n'avaient pas encore été nettoyés. Les connexions entrantes étaient donc encore ajoutées au carnet de commandes du port d'écoute TCP, bien qu'elles n'aient aucune chance d'être acceptées.
Plusieurs de ces réponses sont déclarées "impossibles" à divers endroits dans les interwebs.
Il s'avère que j'avais un thread interne qui exécutait un "appel système" (ioctl dans ce cas) qui prenait quelques heures pour revenir (comportement attendu). Apparemment, le système ne peut pas tuer le processus "à fond" jusqu'à ce qu'il revienne de l'
ioctl
appel, devinez qu'il entre dans le noyau. Au bout de quelques heures, les choses se sont éclaircies et les prises ont toutes été automatiquement fermées, etc. comme prévu. C'est un peu de temps languissant dans le couloir de la mort! Le noyau attendait patiemment de le tuer.Donc, pour répondre au PO, vous devez parfois attendre. Un long moment. Ensuite, le meurtre va enfin prendre.
Consultez également dmesg pour voir s’il existe une panique du noyau (c’est-à-dire un bogue du noyau).
la source