Pause
Lecture
Moteur de recherche d'offres d'emploi CEA

DRT/LIST - Ingénieur Traitement Automatique des Langues (TAL) H/F


Détail de l'offre

Informations générales

Entité de rattachement

Le Commissariat à l'énergie atomique et aux énergies alternatives (CEA) est un organisme public de recherche.

Acteur majeur de la recherche, du développement et de l'innovation, le CEA intervient dans le cadre de ses quatre missions :
. la défense et la sécurité
. l'énergie nucléaire (fission et fusion)
. la recherche technologique pour l'industrie
. la recherche fondamentale (sciences de la matière et sciences de la vie).

Avec ses 16000 salariés -techniciens, ingénieurs, chercheurs, et personnel en soutien à la recherche- le CEA participe à de nombreux projets de collaboration aux côtés de ses partenaires académiques et industriels.  

Référence

2020-13566  

Description du poste

Domaine

Mathématiques, information  scientifique, logiciel

Contrat

CDD

Intitulé de l'offre

DRT/LIST - Ingénieur Traitement Automatique des Langues (TAL) H/F

Statut du poste

Cadre

Durée du contrat (en mois)

12

Description de l'offre

Dans le cadre de sa mission de transfert et de valorisation de ses technologies, le Laboratoire d'Analyse Sémantique des Textes et des Images du CEA (LASTI) recherche un(e) collaborateur/collaboratrice pour la mise en place de démonstrateurs autour de technologies TAL.  Vous rejoindrez une équipe R&D dédiée à l’analyse sémantique de texte et qui a développé l'analyseur linguistique LIMA (https://github.com/aymara/lima/wiki) aujourd'hui  en open source et enrichi de modules d'apprentissage profond lui permettant d'analyser 60 langues avec des performances à l'état de l'art.
Vous participerez à la mise en place des plateformes d’analyse et de recueil des données structurées et non-structurées correspondant aux besoins des utilisateurs.

 

Vous aurez pour missions de : 

  •  Produire de ressources adaptées aux besoins et aux domaines sélectionnés à des fins d'extraction et de recherche d'informations.  Les ressources seront élaborées à l'aide de l'un outil  qui compile de la connaissance à partir des corpus annotés, des listes ou des règles constituées manuellement.
  • Construire une chaîne de traitement complète d'extraction/recherche d'information pour un domaine donné défini pour le besoin du projet, à partir des logiciels et modules du CEA. 
  • Participer à la réflexion et au développement d'outils/fonctions pour faciliter l'adaptation de ressources à de multiples domaines et besoins. L'objectif sera d'augmenter le nombre de règles construites automatiquement et leur fiabilité en s'appuyant sur l'utilisateur.
  • Evaluer les outils d'annotation/extraction comprenant une étude qualitative des annotations.

Profil du candidat

De profil ingénieur ou docteur/titulaire d'un master 2 en Traitement Automatique des Langues et/ou Intelligence Artificielle, nous vous attendons. Une expérience serait appréciée mais pas obligatoire.

Sur le plan scientifique et technique, vous pouvez justifier :
• de solides connaissances dans le domaine du traitement automatique des langues: classification de texte, extraction d'information, constitution de ressources, text mining
• une expérience en développement logiciel s'appuyant idéalement sur une maîtrise de Python/ shell /perl, C++ , des connaissances des webservices REST et d'outils de développement et de partage de code tel que Git.
Vous savez travailler avec autonomie et persévérance, tout en interagissant régulièrement avec votre équipe, afin d'aboutir à la réalisation de démonstrateurs.

Localisation du poste

Site

Saclay

Localisation du poste

France

Ville

Palaiseau - Site de Nano Innov

Demandeur

Disponibilité du poste

01/09/2020