Utilisation du batch system

Contents

Attention ! le batch system est, pour l'instant, uniquement disponible pour le projet LHCb

Certains serveurs communs linux sont membres d'un batch system local. Ce batch system permet aux utilisateurs de lancer des jobs de calcul sans se soucier de l'utilisation courante des machines. Le job sera traité par une machine dès que possible.

Quelles machines ?

NomGroupeRole
lx5.lal.in2p3.frLALCentral Manager
lx4.lal.in2p3.frSIworker
lhcb1.lal.in2p3.frLHCbworker
lhcb2.lal.in2p3.frLHCbworker
lhcb3.lal.in2p3.frLHCbworker

Comment utiliser ?

Soumettre un job

Un script python (condor.py) permet de faciliter la soumission sur le batch scheduler. Ce script s'utilise de la façon suivante :

user@machine> condor.py script_a_demarrer

Pour plus d'information, une aide est disponible avec la commande

user@machine> condor.py --help

Lister les jobs en cours

Vous pouvez voir la liste des jobs en cours avec la commande

user@machine> condor_status -submitters

Les logs du job

Un répertoire est automatiquement crée avec comme nom le nom du script et une chaine de caractère aléatoire

user@machine> ls
[...] drwxr-xr-x 2 philippo si 4096 Apr  2 15:49 script_a_demarrer.1427982589.25