Pause
Lecture
Moteur de recherche d'offres d'emploi CEA

Dépouillement de gros volumes de données non structurés pour des codes de simulation


Détail de l'offre

Informations générales

Entité de rattachement

Situé à 40 km au sud de Paris, le centre DAM-Île de France, a en charge la conception des armes nucléaires françaises, la recherche et développement dans le domaine de la lutte contre la prolifération et le terrorisme, l'alerte aux autorités en cas de séisme, de tsunami ou d'essai nucléaire étranger, la construction et le démantèlement de grandes infrastructures nucléaires. Leader français de la simulation numérique et du calcul intensif, il possède deux des machines européennes les plus puissantes. Il dispose également de plusieurs accélérateurs et de nombreux moyens techniques et expérimentaux pour mener ses recherches. Lui est également rattaché, l'Unité Propulsion Nucléaire située sur le centre CEA/Cadarache en région Provence Alpes-Côte d'Azur, où sont implantées les installations d'essais et une partie des fabrications de la propulsion nucléaire.  

Référence

2019-10688-1319  

Description du poste

Domaine

Systèmes d'information

Contrat

Stage

Durée du contrat (en mois)

6 mois

Description de l'offre

Le CEA, acteur majeur en matière de recherche et d’innovation, est reconnu comme un expert du domaine HPC ayant une implication forte dans le domaine de la simulation numérique. Cette dernière consiste à reproduire par le calcul le fonctionnement d’un système physique, préalablement décrit par un ensemble de modèles mathématiques. L’explosion du volume de données produites par les codes de calcul scientifique sur les supercalculateurs de classe exaflopique impose de mettre en place des stratégies innovantes afin de relâcher les contraintes s’appliquant sur les systèmes de fichiers parallèles et d’améliorer les performances des outils d’analyse, de visualisation et de sauvegarde des données. Un domaine de recherche actif consiste à mettre en place des nouvelles solutions de stockage, visualisation et de traitement des données toujours plus performants. L’objectif de ce stage est de proposer et évaluer une nouvelle chaîne de dépouillement de maillages non structurés (NS) pour les simulations du CEA. Le stagiaire devra notamment : - S’approprier et évaluer les performances des modules Python d’analyse de données que sont pandas et vaex sur des cas identifiés. - Adapter nos jeux de données NS afin de s’interfacer avec le module d’analyse Python retenu. - Regarder tout particulièrement les algorithmes d’extraction et de profil sur ces maillages. Selon l’état d’avancement des travaux et le profil du stagiaire, ce travail pourra être complété par : 1. La prise en compte d’autres filtres/traitements 2. Rendre la chaîne d’analyse parallèle L’ensemble des travaux réalisés sera implémenté et testé en Python. L’étudiant aura pour cela accès à un supercalculateur

Profil du candidat

MASTER/INGENIEUR
C C++ Python CUDA OpenGL
BAC+5

Localisation du poste

Localisation du poste

France, Ile-de-France, Essonne (91)

Ville

Bruyères-le-Châtel