Pause
Lecture
Moteur de recherche d'offres d'emploi CEA

Développement d’un système 'data driven' In-Situ pour des simulations de dynamique moléculaire


Détail de l'offre

Informations générales

Entité de rattachement

Situé à 40 km au sud de Paris, le centre DAM-Île de France, a en charge la conception des armes nucléaires françaises, la recherche et développement dans le domaine de la lutte contre la prolifération et le terrorisme, l'alerte aux autorités en cas de séisme, de tsunami ou d'essai nucléaire étranger, la construction et le démantèlement de grandes infrastructures nucléaires. Leader français de la simulation numérique et du calcul intensif, il possède deux des machines européennes les plus puissantes. Il dispose également de plusieurs accélérateurs et de nombreux moyens techniques et expérimentaux pour mener ses recherches. Lui est également rattaché, l'Unité Propulsion Nucléaire située sur le centre CEA/Cadarache en région Provence Alpes-Côte d'Azur, où sont implantées les installations d'essais et une partie des fabrications de la propulsion nucléaire.  

Référence

2020-14693-S0035  

Description du poste

Domaine

Mathématiques, information  scientifique, logiciel

Contrat

Stage

Intitulé de l'offre

Développement d’un système 'data driven' In-Situ pour des simulations de dynamique moléculaire

Sujet de stage

L’objectif du stage est de faire évoluer le système de post-traitement In-Situ d’un code de dynamique moléculaire massivement parallèle afin qu’il puisse sélectionner des configurations atomiques dont le résultat est mal prédit par le potentiel SNAP et calculer l’écart grâce à un calcul dynamique moléculaire Ab-initio. Si l’écart est important alors la configuration est retenue pour un nouvel apprentissage. La difficulté du stage réside principalement dans la conception d’une heuristique de sélection des configurations atomiques et dans la connexion d’un code Ab-initio au système In-Situ. Ce stage est très orienté: recherche en HPC, machine learning et data driven.
La mise en œuvre des développements fera l’objet d’évaluations sur les machines de puissance du CEA/DIF (voir http://www-hpc.cea.fr/) ainsi que sur des prototypes disposant des derniers processeurs Intel Phi.

Durée du contrat (en mois)

6 mois

Description de l'offre

Des codes de dynamique moléculaire sont mis en œuvre pour simuler et analyser le comportement de matériaux complexes soumis à de fortes sollicitations dynamiques, telles qu’un choc ou une détente rapide.
Il existe de nombreuses méthodes de description des interactions entre atomes (potentiel classique) comme par exemple la méthode de l’atome entouré ou « Embedded Atom Model » (EAM) très utilisée pour la simulation des systèmes métalliques. Malheureusement, ces méthodes ne peuvent pas toujours bien reproduire le comportement des atomes dans certaines conditions de température et densité. Dans ce contexte, une voie prometteuse étudiée concerne le développement de potentiels numériques construits à partir de méthodes de type machine learning comme les réseaux de neurones ou les méthodes à noyaux. Dans ce cadre, le potentiel SNAP [A.P. Thompson, L.P. Swiler, C.R. Trott, S.M. Foiles and G.J. Tucker. Spectral neighbor analysis method for automated generation of quantum-accurate interatomic potentials. Journal of Computational Physics. 285 (2015) 316-330] constitue une première option intéressante à étudier. Les coefficients du potentiel SNAP sont obtenus via un système d’apprentissage externe au code de dynamique moléculaire. Cet apprentissage se fait principalement sur des données fournies par des codes quantiques. Les capacités prédictives d’un tel potentiel sont entièrement déterminées par la base de données d’apprentissage. L’inconvénient principal est d’obtenir des données suffisamment représentatives pour disposer d’une bonne capacité d’apprentissage.

Profil du candidat

Une connaissance en C++ et du parallélisme (MPI, Thread/OpenMP, GPU) est un plus important pour la réalisation de ce stage.
méthode de l’atome entouré (EAM), méthodes de type machine learning comme les réseaux de neurones ou les méthodes à noyaux, méthode ab initio, data driven
Master 2

Localisation du poste

Site

DAM Île-de-France

Localisation du poste

France, Ile-de-France