Contents
Attention ! le batch system est, pour l'instant, uniquement disponible pour le projet LHCb
Certains serveurs communs linux sont membres d'un batch system local. Ce batch system permet aux utilisateurs de lancer des jobs de calcul sans se soucier de l'utilisation courante des machines. Le job sera traité par une machine dès que possible.
Quelles machines ?
Nom | Groupe | Role |
lx5.lal.in2p3.fr | LAL | Central Manager |
lx4.lal.in2p3.fr | SI | worker |
lhcb1.lal.in2p3.fr | LHCb | worker |
lhcb2.lal.in2p3.fr | LHCb | worker |
lhcb3.lal.in2p3.fr | LHCb | worker |
Comment utiliser ?
Soumettre un job
Un script python (condor.py) permet de faciliter la soumission sur le batch scheduler. Ce script s'utilise de la façon suivante :
user@machine> condor.py script_a_demarrer
Pour plus d'information, une aide est disponible avec la commande
user@machine> condor.py --help
Lister les jobs en cours
Vous pouvez voir la liste des jobs en cours avec la commande
user@machine> condor_status -submitters
Les logs du job
Un répertoire est automatiquement crée avec comme nom le nom du script et une chaine de caractère aléatoire
user@machine> ls
[...]
drwxr-xr-x 2 philippo si 4096 Apr 2 15:49 script_a_demarrer.1427982589.25