Pause
Lecture
Moteur de recherche d'offres d'emploi CEA

Ingénieur·e de recherche extraction d'information et data science H/F


Détail de l'offre

Informations générales

Entité de rattachement

Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.

Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.

Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.

Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :

• La conscience des responsabilités
• La coopération
• La curiosité
  

Référence

2024-31777  

Description de la Direction

Basé à Paris-Saclay, le CEA List, membre de l'Université Paris Saclay, est l'un des quatre instituts de recherche technologique de CEA Tech, direction de la recherche technologique du CEA. Dédié aux systèmes numériques intelligents, il contribue au développement de la compétitivité des entreprises par le développement et le transfert de technologies.
L'expertise et les compétences développées par les 800 ingénieurs-chercheurs et techniciens du CEA List permettent à l'Institut d'accompagner chaque année plus de 200 entreprises françaises et étrangères sur des projets de recherche appliquée.

Description de l'unité

Le Laboratoire d'Analyse Sémantique des Textes et des Images (LASTI) est une équipe de 25 personnes (chercheurs, ingénieurs, doctorants) menant des travaux de recherche sur les technologies de description et de compréhension du contenu multimédia (image, texte, parole) et des documents multilingues, en particulier à grande échelle. Les enjeux scientifiques sont :
· développer des algorithmes efficaces et robustes pour l'analyse et l'extraction de contenu multimédia, leur classification et analyse sémantique ;
· reconstitution ou fusion de données hétérogènes pour interpréter des scènes ou documents ;
· développer des méthodes et des outils pour la construction, la formalisation et l'organisation des ressources et connaissances nécessaires au fonctionnement de ces algorithmes ;
· intégrer plusieurs de ces briques technologiques afin d'accéder à l'information et répondre à un besoin utilisateur (moteurs de recherche, agents conversationnels, rapports synthétiques de veille)

Description du poste

Domaine

Systèmes d'information

Contrat

CDD

Intitulé de l'offre

Ingénieur·e de recherche extraction d'information et data science H/F

Statut du poste

Cadre

Durée du contrat (en mois)

18

Description de l'offre

Le LASTI vous invite à rejoindre son équipe pour prendre part à des projets de recherche et développement dans des domaines comme le manufacturing, la santé…. 

Dans le domaine de la santé, parmi les objectifs des projets en cours nous pouvons citer : le développement d’une méthodologie outillée pour la conception et le déploiement de « jumeaux numériques fonctionnels » (Functional Digital Twin) adaptés au monde hospitalier et aux processus qui régissent son fonctionnement ou la l’extraction d’information à partir de comptes-rendus médicaux en vue de réaliser un moteur de recherche facilitant la création des cohortes. Ces outils faciliteront le travail administratif des personnels de santé et permettront de prendre des décisions informées sur l’organisation des processus hospitaliers, anticiper l’impact d’évolutions législatives et réglementaires dans les parcours de soins, évaluer des scénarios d’adaptation ou encore identifier des risques.

Dans nos projets de R&D, nous sommes amenés à collaborer avec des utilisateurs finaux. Dans le cas des projets santé ces utilisateurs sont des représentants des établissements publics de santé qui peuvent fournir le(s) cas d’étude et apportent leurs expertises. En fonction des projets, nos interlocuteurs peuvent également être des chercheurs des autres laboratoires CEA ou des autres organismes de recherche. 

En lien direct avec le(s) chef(s) du projet, vous contribuerez au projet en adaptant les outils existants au laboratoire ou en mettant en œuvre des nouveaux outils innovants pour repérer des concepts existants issus des ontologies et terminologies du domaine et repérer des termes simples et complexes.

Vos missions :

La veille technologique dans les domaines concernés, en cohérence avec la vision des membres du projet ;
Participer à la création de nouvelles briques technologiques et à leur développement : conception et mise en œuvre de nouvelles fonctionnalités en lien avec les besoins projet ;
Adaptation, extension et intégration des briques technologiques existantes pour les besoins d’analyse linguistique du projet ;
Interagir avec les équipes du CEA LIST des autres briques technologiques (par exemple : moteur d’inférence en logique floue et outil de modélisation) ;
Participer à la rédaction de rapports techniques et livrables projets sur la méthode développée dans le projet ainsi qu’aux publications contribuant à la dissémination des résultats.
Le poste sera localisé à Palaiseau (Université Paris-Saclay).

 

#CEA-List

#AI

Profil du candidat

Niveau Bac+5 ou Doctorat avec des connaissances en machine learning, deep learning et traitement automatique des langues,

Compétences techniques (liste informative) :

Languages de programmation : Python, JavaScript, HTML/CSS
Librairies et frameworks : scikit-learn, Pytorch, optuna, spaCy, FastAPI, ONNX, celery transformers. Une connaissance des librairies de manipulation et de visualisation de données est souhaitée (pandas, seaborn, matplotlib).
Devops : docker, docker-compose, slurm, git
Bases de données : MongoDB, Redis, MariaDB

Localisation du poste

Site

Saclay

Localisation du poste

France, Ile-de-France, Essonne (91)

Ville

Palaiseau

Critères candidat

Langues

  • Français (Notions)
  • Anglais (Courant)

Formation recommandée

Doctorat ou Bac+5

Demandeur

Disponibilité du poste

01/07/2024