Pause
Lecture
Moteur de recherche d'offres d'emploi CEA

Topologie réseau et opérations collectives dans MPC


Détail de l'offre

Informations générales

Entité de rattachement

Situé à 40 km au sud de Paris, le centre DAM-Île de France, a en charge la conception des armes nucléaires françaises, la recherche et développement dans le domaine de la lutte contre la prolifération et le terrorisme, l'alerte aux autorités en cas de séisme, de tsunami ou d'essai nucléaire étranger, la construction et le démantèlement de grandes infrastructures nucléaires. Leader français de la simulation numérique et du calcul intensif, il possède deux des machines européennes les plus puissantes. Il dispose également de plusieurs accélérateurs et de nombreux moyens techniques et expérimentaux pour mener ses recherches. Lui est également rattaché, l'Unité Propulsion Nucléaire située sur le centre CEA/Cadarache en région Provence Alpes-Côte d'Azur, où sont implantées les installations d'essais et une partie des fabrications de la propulsion nucléaire.  

Référence

2021-18599-S0435  

Description du poste

Domaine

Mathématiques, information  scientifique, logiciel

Contrat

Stage

Intitulé de l'offre

Topologie réseau et opérations collectives dans MPC

Sujet de stage

Topologie réseau et opérations collectives dans MPC

Durée du contrat (en mois)

6 mois

Description de l'offre

La programmation des supercalculateurs composés de nombreux nœuds de calcul impose l’utilisation de modèle de programmation à mémoire distribuée telle que Message Passing Interface (MPI). Parmi les modèles de communications proposées par MPI, les communications collectives permettent d’appliquer facilement un schéma complexe de communications entre plusieurs processus MPI. Ces schémas de communications peuvent être implémentés avec plusieurs algorithmes différents, montrant différents niveaux d’efficacité selon les cas d’utilisation.

Le support exécutif MPC (https://mpc.hpcframework.com), développé au CEA, propose une implémentation MPI qui lui est propre. Le support des communications collectives de MPC offre déjà différents algorithmes selon les cas d’exécution. Des travaux récents ont permis d’intégrer à MPC des algorithmes dit « topologiques » pour les opérations collectives. Ces algorithmes topologiques tiennent compte de placement des processus MPI et de la topologie matérielle sous-jacente pour établir un schéma de communication adapté. Cependant, à ce jour, la topologie matérielle détéctée dans MPC ne concerne que la topologie matérielle au sein d’un nœud de calcul. Les informations concernant la topologie du réseau et la position des différents nœuds de calcul utilisés lors d’une exécution ne sont pas prises en compte.

Dans ce stage, nous souhaitons implémenter dans MPC une méthodologie pour récolter et intégrer les informations concernant la topologie réseau, et utiliser ces informations dans l’implémentation des algorithmes hiérarchiques.

Dans un premier temps, le(a) stagiaire devra se familiariser avec la bibliothèque MPC, et plus particulièrement son implémentation des algorithmes de collectives dit « topologiques ».
Ensuite, il(elle) réalisera un état de l’art pour identifier les solutions possibles pour détecter la topologie réseau (utilisation de la bibliothèque « netloc », utiliser les informations fournies par PMI, …). Un prototype de récupération des informations sur la topologie réseau sera implémenté.
Enfin, les informations relatives à la topologie réseau devront être intégrées à l’implémentation des algorithmes topologiques de MPC.

Profil du candidat

Programmation C, théorie et algorithmie des graphes
Algorithmique parallèle , Programmation MPI
Bac+4

Localisation du poste

Site

DAM Île-de-France

Localisation du poste

France, Ile-de-France, Essonne (91)

Ville

Bruyères-le-Châtel