Pause
Lecture
Moteur de recherche d'offres d'emploi CEA

Apprentissage supervisé pour la classification automatique de texte H/F


Détail de l'offre

Informations générales

Entité de rattachement

Le Commissariat à l'énergie atomique et aux énergies alternatives (CEA) est un organisme public de recherche.

Acteur majeur de la recherche, du développement et de l'innovation, le CEA intervient dans le cadre de ses quatre missions :
. la défense et la sécurité
. l'énergie nucléaire (fission et fusion)
. la recherche technologique pour l'industrie
. la recherche fondamentale (sciences de la matière et sciences de la vie).

Avec ses 16000 salariés -techniciens, ingénieurs, chercheurs, et personnel en soutien à la recherche- le CEA participe à de nombreux projets de collaboration aux côtés de ses partenaires académiques et industriels.  

Référence

2021-18079  

Description de l'unité

Au sein du CEA List, le Laboratoire LASTI (Laboratoire Analyse Sémantique Texte et Image) travaille sur l'analyse de contenus multimédia. Dans le domaine de l'analyse de texte, nous recherchons un.e CDD ingénieur.e ou docteur.e pour travailler sur la classification automatique de texte.

Description du poste

Domaine

Mathématiques, information  scientifique, logiciel

Contrat

CDD

Intitulé de l'offre

Apprentissage supervisé pour la classification automatique de texte H/F

Statut du poste

Cadre

Durée du contrat (en mois)

18

Description de l'offre

La mission principale du/de la candidat.e sera de développer une plateforme de classification automatique de texte basée sur des algorithmes d’apprentissage supervisé. Il/elle participera à la conception de cette plateforme et sera en charge de la développer. En particulier les tâches du/de la candidat.e consisteront à :

•  prendre en main et améliorer les outils existants développés au sein du laboratoire ;

•  mettre en place une plateforme dans un contexte applicatif industriel ;

•  effectuer de la veille technologique et scientifique ;

•  intégrer et/ou développer de nouveaux algorithmes.

 

Le/la candidat.e sera amené.e à travailler sur tous les aspects du développement de la plateforme : conception, programmation, packaging et déploiement. Dans ce contexte, une familiarité avec Linux et l’outil Docker est un avantage. Par ailleurs, le langage de programmation principal sera Python.

Profil du candidat

Niveau Bac+5 ou Doctorat avec des connaissances en machine learning, deep learning et traitement automatique des langues.

Compétences techniques (liste informative) :

•  Languages de programmation : Python, JavaScript, HTML/CSS

•  Librairies et frameworks : scikit-learn, Pytorch, optuna, spaCy, FastAPI, ONNX, celery transformers. Une connaissance des librairies de manipulation et de visualisation de données est souhaitée (pandas, seaborn, matplotlib)

•  Devops : docker, docker-compose, slurm, git

•  Bases de données : MongoDB, Redis, MariaDB

 

Rémunération selon formation.


Les candidat.e.s intéressé.e.s doivent envoyer un email de candidature avec un CV détaillé et une lettre de motivation (au format PDF) aux adresses suivantes :

•  julien.tourille@cea.fr

•  bianca.vieru@cea.fr

Localisation du poste

Site

Saclay

Localisation du poste

France

Ville

Palaiseau (site de Nano Innov)

Demandeur

Disponibilité du poste

01/10/2021