Pause
Lecture
Moteur de recherche d'offres d'emploi CEA

Modèles neuronaux génératifs pour un agent conversationnel réaliste H/F


Détail de l'offre

Informations générales

Entité de rattachement

Le Commissariat à l'énergie atomique et aux énergies alternatives (CEA) est un organisme public de recherche.

Acteur majeur de la recherche, du développement et de l'innovation, le CEA intervient dans le cadre de ses quatre missions :
. la défense et la sécurité
. l'énergie nucléaire (fission et fusion)
. la recherche technologique pour l'industrie
. la recherche fondamentale (sciences de la matière et sciences de la vie).

Avec ses 16000 salariés -techniciens, ingénieurs, chercheurs, et personnel en soutien à la recherche- le CEA participe à de nombreux projets de collaboration aux côtés de ses partenaires académiques et industriels.  

Référence

2022-23606  

Description de l'unité

Au Département Intelligence Ambiante et Systèmes Interactifs (DIASI), les équipes du Laboratoire d'Analyse Sémantique Texte et Image (LASTI) développent des technologies innovantes de traitement automatique des langues et des données multimédia, fondées, pour ce qui est du texte, sur la plateforme d'analyse multilingue libre LIMA. Les sujets abordés au sein du laboratoire vont de l'extraction d'information jusqu'aux agents conversationnels, en passant par la construction de ressources linguistiques pour les langues peu dotées.

Description du poste

Domaine

Sciences pour l'ingénieur

Contrat

Stage

Intitulé de l'offre

Modèles neuronaux génératifs pour un agent conversationnel réaliste H/F

Sujet de stage

Les agents conversationnels, autrement appelés chatbots, ont fait l'objet d'un phénomène de mode impressionnant il y a quelques années. Depuis, la ferveur est retombée. Les technologies se sont standardisées autour de détecteurs d'intention et d'accès aux bases de données.
Les agents conversationnels ont aussi été expérimentés dans des approches plus riches, comme le dialogue patient / médecin. L'utilisation dans le cadre de la formation des étudiants en médecine a été explorée par notre laboratoire.
Ce stage s'inscrit dans le cadre d'une thèse en cours de montage dont l'objectif sera de créer un agent conversationnel réaliste, doté d'une « personnalité ». Le modèle de génération de réponse devra prendre en entrée une description des connaissances de l'agent sur le monde, sur lui-même et sur la conversation en cours de façon à générer des réponses en cohérence avec ce modèle.

Durée du contrat (en mois)

6

Description de l'offre

Les agents conversationnels, autrement appelés chatbots, ont fait l’objet d’un phénomène de mode impressionnant il y a quelques années. Depuis, la ferveur est retombée. Les chatbots sont devenus des outils parmi d’autres dans la relation client sur internet.
Les agents conversationnels ont aussi été expérimentés dans des approches plus riches. L’utilisation dans le cadre de la formation des étudiants en médecine a été explorée par notre laboratoire avec les partenaires du projet LabForSims2 [1]. Nous avons aussi expérimenté une utilisation dans un cadre artistique avec l’artiste Rocio Berenguer qui souhaitait un agent réaliste mais poétique [2].
Il est désormais très facile de créer un agent conversationnel pour une tâche donnée. Il est même faisable de lui faire accepter des entrées variées non prévues à l’avance et de lui faire générer un texte fluide, syntaxiquement et sémantiquement correct. Par contre, il est très difficile de produire un agent générique capable de s’adapter très rapidement à une tâche nouvelle [3].

Ce stage s'inscrit dans le cadre d'une thèse en cours de montage dont l’objectif sera de créer un agent conversationnel réaliste, doté d’une « personnalité ». Le modèle de génération devra prendre en entrée une description des connaissances de l’agent sur le monde, sur lui-même et sur la conversation en cours de façon à générer des réponses en cohérence avec ce modèle. Ces connaissances externes devront pouvoir être facilement remplacées ou mises à jour. L’agent conversationnel produit pourra être expérimenté dans le cadre du projet européen Cortex² visant à produire des outils facilitant l’expérience des réunions en ligne.
L'objectif du stage consiste à participer à la conception des modèles génératifs pouvant prendre en compte des connaissances externes pour la génération de dialogues et à les expérimenter à l'aide des corpus existant ainsi que d'un corpus multilingue en cours de développement et auquel participe le laboratoire.

Le travail du stagiaire consistera à :
-se familiariser avec le domaine des agents conversationnels en effectuant une étude bibliographique approfondie;
-proposer des modèles génératifs adaptés à la tâche en s'inspirant de l'état de l'art;
-entraîner les modèles et les optimiser sur le cluster FactoryIA [4] du CEA;
-évaluer la qualité des dialogues générés par les modèles.

[1] Laleye F. A. A., Blanié A., Brouquet A., Behnamou D. & Chalendar G. d. (2020b). Semantic similarity to improve question understanding in a virtual patient. SAC ’20

[2] Laleye F., de Chalendar G., Frey L. & Berenguer R. (2020a). Iagotchi : vers un agent conversationnel artistique. TALN 2020

[3] Hogan K., Baer A. & Purtilo J. (2021). Diplomat : A Conversational Agent Framework for Goal-Oriented Group Discussion. In Contemporary Issues in Group Decision and Negotiation, Lecture Notes in Business Information Processing, p. 143–154.

[4] https://www.hpcg-benchmark.org/custom/index.html?lid=155&slid=310

#StageList

Moyens / Méthodes / Logiciels

traitement automatique des langues, deep learning, évaluation, pytorch, python

Profil du candidat

Le ou la candidate sera en master 2 ou en troisième année d'école d'ingénieur avec une forte composante d'informatique et en particulier de réseaux de neurones. Une bonne connaissance du traitement automatique des langues serait un plus.

Un excellent niveau sera exigé, en particulier si le ou la candidate désire ensuite candidater à la thèse proposée.

Localisation du poste

Site

Saclay

Localisation du poste

France, Ile-de-France, Essonne (91)

Ville

Palaiseau

Critères candidat

Langues

Anglais (Courant)

Diplôme préparé

Bac+5 - Master 2

Formation recommandée

Informatique

Possibilité de poursuite en thèse

Oui

Demandeur

Disponibilité du poste

02/01/2023