Pause
Lecture
Moteur de recherche d'offres d'emploi CEA

Modèles de réseaux de neurones sur graphes pour l'analyse de données massives


Détail de l'offre

Informations générales

Entité de rattachement

Situé à 40 km au sud de Paris, le centre DAM-Île de France, a en charge la conception des armes nucléaires françaises, la recherche et développement dans le domaine de la lutte contre la prolifération et le terrorisme, l'alerte aux autorités en cas de séisme, de tsunami ou d'essai nucléaire étranger, la construction et le démantèlement de grandes infrastructures nucléaires. Leader français de la simulation numérique et du calcul intensif, il possède deux des machines européennes les plus puissantes. Il dispose également de plusieurs accélérateurs et de nombreux moyens techniques et expérimentaux pour mener ses recherches. Lui est également rattaché, l'Unité Propulsion Nucléaire située sur le centre CEA/Cadarache en région Provence Alpes-Côte d'Azur, où sont implantées les installations d'essais et une partie des fabrications de la propulsion nucléaire.  

Référence

2021-18533-S0365  

Description du poste

Domaine

Mathématiques, information  scientifique, logiciel

Contrat

Stage

Intitulé de l'offre

Modèles de réseaux de neurones sur graphes pour l'analyse de données massives

Sujet de stage

Modèles de réseaux de neurones sur graphes pour l'analyse de données massives

Durée du contrat (en mois)

4 à 6 mois

Description de l'offre

Un grand nombre de données, issues de différents domaines (neurosciences, réseaux sociaux, ...) se prête à une représentation à l'aide de graphes. Le graphe est un objet mathématique constitué d'un ensemble de nœuds qui peuvent représenter toutes sortes d'abstractions (un capteur au sein d'un système de détection, un atome dans une molécule, ...) et d'un ensemble d'arêtes entre deux nœuds représentant une relation entre eux. Ces arêtes peuvent se voir attribuer un poids qui peut représenter une probabilité par exemple. La représentation d'un graphe consiste à lui associer un vecteur dans un espace de dimension élevée (on parle de plongement), opération qui peut faire appel à des algorithmes de machine learning (ML).
Les premiers travaux dans le domaine du Graph ML ont vu le jour il y a cinq années environ, avec la généralisation des réseaux de neurones convolutifs (CNN) aux graphes. Au lieu d'opérer sur les pixels d'une image, la convolution prend en compte pour chaque nœud un voisinage défini par les nœuds directement reliés par une arête. On distingue aujourd'hui divers types de GNNs (Graph Attention Network, Multigraph Transformer, ...). Dès lors que des données vectorielles sont associées aux nœuds du graphe, se pose la question du traitement des signaux sur graphe. Il s’agit d’un domaine récent qui connaît une forte progression en raison du succès des outils classiques de traitement du signal et du champ des applications qu’ouvre ce domaine (réseaux fonctionnels du cerveau, nuages de points 3D couleur, …).
L'objectif de ce stage est d’adapter des architectures de GNNs en (1) ajoutant des effets de propagation en temps fini au sein du graphe et (2) en tirant parti des propriétés des signaux sur graphe. Les délais peuvent être modélisés via un modèle de propagation qui représente la façon dont « circule » l’information à l’échelle du graphe. Les validations seront réalisées à partir des données du Système de surveillance international (SSI), qui est un exemple de graphe à l'échelle du globe. Le SSI permet de disposer de nombreuses données sismiques, acoustiques et hydroacoustiques. Les évènements détectés (séismes, éruptions, explosions, ...) sont répertoriés dans des bulletins automatiques et accompagnés de métadonnées qui renseignent sur certaines caractéristiques des signaux.
Le Graph ML est depuis deux années un thème de recherche particulièrement actif, dont les applications se multiplient. Ainsi, depuis septembre 2020, la fonction de Google Maps qui fournit une estimation de l'heure d'arrivée à l'issue d'un trajet fait appel au Graph ML. Ce stage de M2 s'intègre dans un projet plus vaste au CEA DAM, en collaboration avec l’ENS Paris-Saclay, dont l'objectif est de développer des méthodes de ML pour traiter des données collectées à l’échelle du globe.

Profil du candidat

Compétences dans le domaine des réseaux de neurones.
Python
Bac+5

Localisation du poste

Site

DAM Île-de-France

Localisation du poste

France, Ile-de-France, Essonne (91)

Ville

Bruyères-le-Châtel