Pause
Lecture
Moteur de recherche d'offres d'emploi CEA

Post-Doc sur le TAL pour l'aide à la conception de nouveaux matériaux H/F


Détail de l'offre

Informations générales

Entité de rattachement

Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.

Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.

Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.

Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :

• La conscience des responsabilités
• La coopération
• La curiosité
  

Référence

2024-31098  

Description de la Direction

Au sein de CEA Tech, le pôle « recherche technologique » du CEA, l'Institut List dédie ses activités aux systèmes numériques intelligents avec des programmes de R&D dans le manufacturing avancé, les systèmes embarqués, et l'intelligence ambiante. Nous accompagnons nos partenaires dans les domaines des transports, de l'industrie, de l'énergie, de la santé, de la sécurité et de la défense, pour transférer les technologies issues de l'innovation et améliorer leur compétitivité.

Description de l'unité

Au Département Intelligence Ambiante et Systèmes Interactifs (DIASI), les équipes du Laboratoire d’Analyse Sémantique Texte et Image (LASTI) développent des technologies innovantes de traitement automatique des langues et des données multimédia et multilingues. Les sujets abordés au sein du laboratoire vont de l’analyse et l’extraction d’information à partir de documents textes et images jusqu’aux agents conversationnels, en passant par la construction de ressources linguistiques pour les langues peu dotées.

Description du poste

Domaine

Sciences pour l'ingénieur

Contrat

CDD

Intitulé de l'offre

Post-Doc sur le TAL pour l'aide à la conception de nouveaux matériaux H/F

Statut du poste

Cadre

Durée du contrat (en mois)

24 mois

Description de l'offre

Dans le cadre d’un projet de recherche en association avec d’autres laboratoires du CEA, le LASTI vise à exploiter les technologies du Traitement Automatique des Langues (TAL) pour automatiser l’extraction d’information depuis la littérature scientifique dans le domaine des matériaux. 

Plus précisément, le domaine d’application du projet est le design de matériaux innovants : cet objectif nécessite d’explorer l’état de l’art pour connaître les données matériaux, par exemple les compositions chimiques et les valeurs ou tendances concernant les propriétés clés mesurées dans l’étude ainsi que les caractéristiques du type d’essais réalisé. L’objectif du projet est d’exploiter des techniques d’intelligence artificielle pour réaliser cette exploration de façon automatique et extraire les données d’intérêt à partir du texte des articles scientifiques ou brevets considérés.

L’objectif à terme sera d’intégrer les informations extraites dans un système existant de raisonnement automatique à base d’inférence en logique floue pour fournir un assistant numérique pour le design des matériaux. Le travail se fera en collaboration avec le laboratoire du CEA qui développe ce système de raisonnement et un laboratoire du CEA spécialisé sur les matériaux qui apportera son expertise sur les informations pertinentes à extraire.

Les missions du poste seront les suivantes :

- Réaliser un état de l’art dans l’application du TAL pour les données matériaux;
- Constituer un jeu de données de référence d’articles scientifiques à partir de sources identifiées (journaux, sites)
- Développer des approches pour l’extraction d’information à partir de ces données : on s’intéressera en particulier (1) aux approches frugales : sans apprentissage (zero-shot), en s’appuyant sur de grands modèles de langue (LLMs) ou avec un apprentissage à partir de peu de données (few-shot learning) ; (2) aux approches d'IA hybride combinant l’exploitation de connaissances explicites (bases de données, thesaurus) avec les modèles par apprentissage.

Profil du candidat

Niveau Doctorat avec des connaissances en machine learning, deep learning et traitement automatique des langues,

Compétences techniques (liste informative) :

- Langages de programmation : Python
- Librairies et frameworks : scikit-learn, Pytorch, transformers, optuna, spaCy
- Devops : docker, docker-compose, slurm, git

 

Localisation du poste

Site

Saclay

Localisation du poste

France, Ile-de-France, Essonne (91)

Ville

Palaiseau

Critères candidat

Formation recommandée

Doctorat en Intelligence Artificielle

Demandeur

Disponibilité du poste

06/05/2024