Pause
Lecture
Moteur de recherche d'offres d'emploi CEA

Machine Learning pour la prédiction des ressources utilisées par un calcul parallèle


Détail de l'offre

Informations générales

Entité de rattachement

Situé à 40 km au sud de Paris, le centre DAM-Île de France, a en charge la conception des armes nucléaires françaises, la recherche et développement dans le domaine de la lutte contre la prolifération et le terrorisme, l'alerte aux autorités en cas de séisme, de tsunami ou d'essai nucléaire étranger, la construction et le démantèlement de grandes infrastructures nucléaires. Leader français de la simulation numérique et du calcul intensif, il possède deux des machines européennes les plus puissantes. Il dispose également de plusieurs accélérateurs et de nombreux moyens techniques et expérimentaux pour mener ses recherches. Lui est également rattaché, l'Unité Propulsion Nucléaire située sur le centre CEA/Cadarache en région Provence Alpes-Côte d'Azur, où sont implantées les installations d'essais et une partie des fabrications de la propulsion nucléaire.  

Référence

2021-18587-S0423  

Description du poste

Domaine

Mathématiques, information  scientifique, logiciel

Contrat

Stage

Intitulé de l'offre

Machine Learning pour la prédiction des ressources utilisées par un calcul parallèle

Sujet de stage

Machine Learning pour la prédiction des ressources utilisées par un calcul parallèle

Durée du contrat (en mois)

5 à 6 mois

Description de l'offre

R&D du laboratoire en matière d’ingénierie de la donnée dans un environnement de calcul haute performance.

L'exécution d'un calcul parallèle dans un environnement HPC nécessite la réservation de ressources (processeurs, mémoire…). L’évaluation des ressources nécessaires dépend de plusieurs paramètres difficiles à quantifier. L'objectif est de guider l'utilisateur dans cette décision.
L'objectif est d'analyser les données issues d'exécutions de différents jobs et d'appliquer une méthode de Machine Learning (ML) afin de prédire les ressources les plus adaptées à l'exécution de futurs jobs.
Une première phase comporte l'analyse statistique des données à disposition pour cette étude. Ces données contiennent notamment les informations transmises par l'utilisateur (métadonnées) lors de l'exécution de jobs de calcul sur les machines du CEA, au travers d'un logiciel de gestion de production.
La seconde phase du stage comprend l'élaboration et l'application d'un algorithme de ML pour prédire les ressources de calcul à utiliser pour chaque job, à partir de l'étude précédente des métadonnées des jobs exécutés.

Profil du candidat

Autonomie, Rédaction, Capacité d'adaptation, Esprit d'initiative
Linux, Python, Tensorflow ou Pytorch, Keras, Scikit-Learn, Méthodes d'analyse statistique
Bac+4

Localisation du poste

Site

DAM Île-de-France

Localisation du poste

France, Ile-de-France, Essonne (91)

Ville

Bruyères-le-Châtel