Pause
Lecture
Moteur de recherche d'offres d'emploi CEA

Stage - Apprentissage de représentation et par renforcement H/F


Détail de l'offre

Informations générales

Entité de rattachement

Le Commissariat à l'énergie atomique et aux énergies alternatives (CEA) est un organisme public de recherche.

Acteur majeur de la recherche, du développement et de l'innovation, le CEA intervient dans le cadre de ses quatre missions :
. la défense et la sécurité
. l'énergie nucléaire (fission et fusion)
. la recherche technologique pour l'industrie
. la recherche fondamentale (sciences de la matière et sciences de la vie).

Avec ses 16000 salariés -techniciens, ingénieurs, chercheurs, et personnel en soutien à la recherche- le CEA participe à de nombreux projets de collaboration aux côtés de ses partenaires académiques et industriels.  

Référence

2020-14562  

Description de l'unité

Basé à Paris-Saclay, le CEA List est l'un des quatre instituts de recherche technologique de CEA Tech, direction de la recherche technologique du CEA. Dédié aux systèmes numériques intelligents, il contribue au développement de la compétitivité des entreprises par le développement et le transfert de technologies.
L'expertise et les compétences développées par les 800 ingénieurs-chercheurs et techniciens du CEA List permettent à l'Institut d'accompagner chaque année plus de 200 entreprises françaises et étrangères sur des projets de recherche appliquée s'appuyant sur 4 programmes et 9 plateformes technologiques. 21 start-ups ont été créées depuis 2003.
Labellisé Institut Carnot depuis 2006, le CEA List est aujourd'hui l'institut Carnot Technologies Numériques.
Le Laboratoire de Vision et Apprentissage pour l'analyse de scène (LVA) mène ses recherches dans le domaine de la Vision par Ordinateur (Computer Vision) selon quatre axes principaux :
- La reconnaissance visuelle (détection et/ou segmentation d'objets, de personnes, de patterns ; détection d'anomalies ; caractérisation)
- L'analyse du comportement (reconnaissance de gestes, d'actions, d'activités, de comportements anormaux ou spécifiques pour des individus, un groupe, une foule)
- Annotation intelligente (annotation à grande échelle de données visuelles 2D/3D de manière semi-automatique)
- Perception et décision (processus de décision markovien, navigation)

Description du poste

Domaine

Sciences pour l'ingénieur

Contrat

Stage

Intitulé de l'offre

Stage - Apprentissage de représentation et par renforcement H/F

Sujet de stage

Apprentissage de représentation et apprentissage par renforcement pour la navigation autonome.

Durée du contrat (en mois)

6

Description de l'offre

L’apprentissage par renforcement a permis de développer des algorithmes capables de battre les humains dans différentes tâches de contrôle et prise de décision comme les jeux atari ou les jeux de plateau (Go,  Echecs). Son utilisation pour la conduite autonome est prometteur mais souffre de plusieurs problèmes :
-        Il est difficile de résoudre le problème d’optimisation associé à ces algorithmes quand les espaces d’états et d’action sont de très grande dimension.
-        La phase d’apprentissage nécessite beaucoup d’interaction entre l’agent et l’environnement. C’est un processus difficile à mettre en œuvre dans le cas de la conduite autonome.
-        Les algorithme d’apprentissage par renforcement sont souvent aperçus comme une boite noire. Or les notions d’explicabilité et d’interprérabilité sont primordiales pour faire accepter ces solutions dans le monde de l’automobile.
Ce stage a pour objectif d’apporter des solutions à ces problèmes. Notamment, en étudiant les méthodes d’apprentissage de représentation pour réduire la dimensionnalité des espaces d’états et d’actions. Pour limiter l’interaction avec l’environnement il est possible de s’appuyer sur les techniques d’apprentissage hors-ligne (offline reinforcement learning). Finalement, la notion d’interprétabilité peut être introduite dans ces algorithmes en ajoutant des tâches à niveau sémantique élevé dans ses algorithmes (prédiction de trajectoire, segmentation de la scène, … ). Il sera demandé au stagiaire de faire une étude bibliographique, de proposer et d’implémenter une solution aux différents problèmes soulevés et finalement procéder à une validation expérimentale.

Profil du candidat

Compétences requises :
- Vision par ordinateur
- Apprentissage automatique (deep learning)
- Reconnaissance de formes
- C/C++, Python
- La maîtrise d'un framework d'apprentissage profond (en particulier Tensorflow ou PyTorch) est un plus.

Localisation du poste

Site

Saclay

Localisation du poste

France, Ile-de-France, Essonne (91)

Ville

Saclay

Critères candidat

Diplôme préparé

Bac+5 - Master 2

Formation recommandée

Apprentissage statistique, apprentissage par renforcement

Possibilité de poursuite en thèse

Oui

Demandeur

Disponibilité du poste

20/10/2020