Est-il possible de suspendre les travaux soumis via qsub?

10

J'exécute mes travaux sur un petit cluster. Je les ai soumis via qsub. Maintenant, mes camarades de laboratoire ont besoin de ressources de façon plus urgente que moi, je dois donc soit tuer mes emplois, soit les suspendre, si possible.

Existe-t-il un moyen de suspendre mes travaux et de libérer le CPU, la RAM, etc.?

Je suis un utilisateur normal (pas de privilèges root).

Sibbs Gambling
la source
1
Vous pouvez retenir vos travaux non encore exécutés avec qhold, mais cela n'affecte pas les travaux déjà en cours d'exécution. Il semble que cela qmodpuisse suspendre les travaux en cours d'exécution, mais il a besoin des privilèges root ou gestionnaire.
jofel
En supposant que vous disposez d'un cluster MOAB: vous pouvez suspendre votre travail (s'il est configuré en conséquence), mais seul l'administrateur peut le reprendre: docs.adaptivecomputing.com/mwm/Content/topics/jobAdministration/…
Ott Toomet

Réponses:

6

Si les travaux n'ont pas commencé, vous pouvez les suspendre qhold. Utilisez qrlspour redémarrer.

qhold <job ID>
qrls <job ID>

S'ils sont déjà en cours d'exécution, vous pouvez utiliser qsigpour suspendre et reprendre les travaux (vous pouvez avoir besoin d'autorisations supplémentaires pour cela, demandez à votre administrateur si c'est le cas):

qsig -s suspend <job ID>
qsig -s resume <job ID>

Une fois que vous avez repris votre travail, vous devrez peut-être le forcer à qrun

qrun <job ID>

Testé sur un système SLES 11 SP4 avec PBSPro 13.0.2.153173, mais je suis convaincu qu'il devrait fonctionner avec d'autres systèmes de soumission de travaux par lots compatibles POSIX.

Calimo
la source