È possibile mettere in pausa i lavori inviati tramite qsub?


10

Sto eseguendo i miei lavori su un piccolo cluster. Li ho inviati tramite qsub. Ora i miei compagni di laboratorio hanno bisogno di risorse più urgentemente di me, quindi devo uccidere i miei lavori o metterli in pausa, se possibile.

Esiste un modo per mettere in pausa i miei lavori e rilasciare CPU, RAM, ecc.?

Sono un utente normale (nessun privilegio di root).


1
È possibile trattenere i lavori non ancora in esecuzione con qhold, ma ciò non influisce sui lavori già in esecuzione. Sembra che qmodpossa sospendere i lavori in esecuzione, ma necessita dei privilegi di root o manager.
jofel,

Supponendo che tu abbia un cluster MOAB: puoi sospendere il tuo lavoro (se configurato di conseguenza), ma solo l'amministratore può riprenderlo: docs.adaptivecomputing.com/mwm/Content/topics/jobAdministration/…
Ott Toomet

Risposte:


6

Se i lavori non sono stati avviati, è possibile metterli in attesa qhold. Utilizzare qrlsper riavviare.

qhold <job ID>
qrls <job ID>

Se sono già in esecuzione, è possibile utilizzare qsigper sospendere e riprendere i lavori (potrebbe essere necessario disporre di autorizzazioni aggiuntive, chiedere all'amministratore se è così):

qsig -s suspend <job ID>
qsig -s resume <job ID>

Dopo aver ripreso il lavoro, potrebbe essere necessario forzarlo per l'esecuzione qrun

qrun <job ID>

Testato su un sistema SLES 11 SP4 con PBSPro 13.0.2.153173, ma sono sicuro che dovrebbe funzionare con altri sistemi di inoltro di lavori batch conformi a POSIX.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.