Pause
Lecture
Moteur de recherche d'offres d'emploi CEA

Ingénieur chercheur traitement automatique des langues H/F


Détail de l'offre

Informations générales

Entité de rattachement

Le Commissariat à l'énergie atomique et aux énergies alternatives (CEA) est un organisme public de recherche.

Acteur majeur de la recherche, du développement et de l'innovation, le CEA intervient dans le cadre de ses quatre missions :
. la défense et la sécurité
. l'énergie nucléaire (fission et fusion)
. la recherche technologique pour l'industrie
. la recherche fondamentale (sciences de la matière et sciences de la vie).

Avec ses 16000 salariés -techniciens, ingénieurs, chercheurs, et personnel en soutien à la recherche- le CEA participe à de nombreux projets de collaboration aux côtés de ses partenaires académiques et industriels.  

Référence

2020-15504  

Description de la Direction

Le CEA List est un laboratoire de 800 personnes, localisé sur le plateau de Saclay (91), dont les axes de recherche s'inscrivent dans le domaine des systèmes complexes à dominante logiciel. La mission du CEA List est le transfert d'innovation vers le monde industriel. Par ce positionnement, le CEA List occupe une place privilégiée dans les réseaux de collaboration entre laboratoires académiques, centre de recherche et acteurs industriels (grand groupes et PME) à l'échelle européenne et mondiale.

Description de l'unité

Au sein du CEA List, le Laboratoire d'Analyse Sémantique Texte et Image (www.kalisteo.eu) regroupe des chercheurs autour de thèmes de recherche qui sont l'analyse de document Multimédia (analyse jointe texte et image), le traitement du langage naturel et des activités autour de la vision par ordinateur.

Description du poste

Domaine

Mathématiques, information  scientifique, logiciel

Contrat

CDD

Intitulé de l'offre

Ingénieur chercheur traitement automatique des langues H/F

Statut du poste

Cadre

Durée du contrat (en mois)

18

Description de l'offre

Dans le cadre de projets de recherche structurant du laboratoire, en partenariat avec des partenaires académiques et industriels, vous aurez la mission de mener des recherches et développer des techniques d’extraction d’information étendue, par apprentissage automatique supervisé (Deep Learning).

Dans le domaine médical, l’analyse des données textuelles contenus dans les dossiers patients permet de faciliter l’accès à l’information d’intérêt. Ces outils accélèrent les études épidémiologiques, optimise les processus administratifs, facilite le suivi des patients et de manière générale libère du temps de médecin pour le traitement efficace des patients.

En général, l’extraction d’information a pour objectif d’identifier des informations structurées dans des contenus textuels. Nous définissons l’extraction d’information étendue comme l’identification d’informations structurées à la fois directement présentes dans le texte (dans une tâche de surlignage, par exemple l’identification d’entités nommées) mais aussi des informations non directement présentes dans le texte (par exemple, associations d’étiquettes thématiques). Plus précisément, l’extraction d’information étendue combine l’extraction d’information classique et la classification automatique de textes :

Extraction d’information : identification dans les textes d’informations spécifiques (entités nommées, relations, événements). Cette identification peut combiner des techniques symboliques à base de patrons morpho-syntaxiques et des techniques à base d’apprentissage automatique.
Classification automatique : annotation automatique de textes par des étiquettes prédéfinies inférées à partir du contenu du texte. Les techniques utilisées dans ce cadre seront des techniques d’apprentissage automatique statistique (standard ou neuronales).

Plus précisément, sous la responsabilité d’un chef de projet, vous serez en charge :
De contribuer à la réflexion scientifique et technique nécessaire à la réalisation du projet;
De réaliser la veille scientifique et technologique ;
De prendre en main et améliorer les outils existants sur ces deux tâches d’extraction d’information et de classification automatique ;
De mettre en place une plateforme combinant ces deux tâches dans un contexte applicatif ;
D’étudier les interactions entre ces deux tâches : comment l’extraction d’information peut aider la classification automatique ou réciproquement.

Profil du candidat

Profil du candidat
• Docteur.e ou ingénieur.e en traitement du langage naturel.
• Connaissances en Machine learning, Deep Learning et dans le domaine du traitement automatique des langues: classification de texte, extraction d'information, constitution de ressources, text mining.
• Expérience en développement logiciel s'appuyant idéalement sur une maîtrise de Python/ shell /perl, C++ , des connaissances des webservices REST et d'outils de développement et de partage de code tel que Git.
• Expérience de l'environnement Linux.
• Autonome, rigoureux/rigoureuse et doté.e d'une forte motivation.
• Appétence pour le travail collaboratif et en équipe.


CDD de 18 mois au CEA de Saclay (91). Salaire selon diplômes et expériences.
Les candidat.e.s intéressé.e.s doivent envoyer un email de candidature à bianca.vieru@cea.fr avec un CV détaillé (pdf) et une lettre de motivation.

Localisation du poste

Site

Saclay

Localisation du poste

France

Ville

Palaiseau

Demandeur

Disponibilité du poste

01/01/2021