Titre : Développement d'un système question / réponse pour l'application mobile d'un cyber opéra Encadrant : Jean-Pierre Chevallet, équipe MRIM du Laboratoire d'Informatique de Grenoble (LIG) Contact : jean-pierre.chevallet@imag.fr Lieu : Laboratoire d'Informatique de Grenoble (LIG), Bâtiment IMAG, 700 avenue Centrale, Domaine Universitaire de Saint-Martin-d'Hères Durée : 5-6 mois Financement : celui d'un stage (1/3 du SMIC), financé par MIAI@Grenoble Alpes, (ANR-19-P3IA-0003) Mot clés : Accès à l'information, Intelligence artificielle, Traitement automatique de la langue naturelle, Apprentissage automatique, Apprentissage profond par réseaux de neurones, Génération automatique de phrases, Interaction homme machine avec un avatar, plongements de mots (embeddings), BERT et FlauBERT, programmation mobile. Contexte Ce projet est dans le contexte du montage d'un spectacle qui sera en tournée en France à partir de fin 2022 avec des répétitions prévue fin 2021. La première aura lieu à partir du printemps 2022 à Grenoble (Hexagone de Meylan). Il s'agit d'un "cyber-opéra" sur le thème de l'interaction d'un robot avec les humains, plus précisément, il s'agit de suivre l'évolution d'une intelligence artificielle en apprentissage avec les humains. Cet oeuvre artistique posera des questions sur le rôle des machines dans notre réalité, en particulier le rôle de l'intelligence artificielle. Le spectacle mettra en scène un robot ayant une intelligence artificielle, mais ce robot sera en fait animés par un acteur. Par contre, il est prévu une application sur téléphone mobile, qui permettra au spectateur ayant acheté un billet pour le spectacle, de faire connaissance avec le robot du spectacle, et d'avoir des informations sur le contenu du spectacle sous la forme d'énigmes à résoudre. Le spectacle en lui même répondra à une partie de l'énigme mais l'énigme se poursuivra dans l'application mobile après le spectacle. Le projet informatique consiste à participer au développement de cette application, en relation avec le scénariste, le musicien, les designers (visuel, et audio), le metteur en scène et une structure d'aide et d'accueil au CEA de Grenoble. Le stage se déroulera au Laboratoire d'Informatique de Grenoble (LIG). Le développement se fera en collaboration avec une start-up spécialisée dans la conception et la réalisation d'avatars interactifs sur téléphone portable. Un serveur devra être mis en place pour la partie intelligence artificielle. Le but du développement informatique est de servir l'oeuvre mais aussi de rendre visible à des néophytes le travail scientifique réalisé dans le Laboratoire Informatique de Grenoble, en particulier le modèle de langue FlauBERT, réalisé par l'équipe GETALP du LIG. Sujet du stage Le projet concerne le développent de l'application sur téléphone mobile qui sera disponible pour les spectateurs, avant et après le spectacle. Cette application sera développée à priori dans le langage Dart et l'environnement Flutter. Le développement de la partie mobile fera l'objet d'un autre stage. Dans ce stage, il s'agit du développement d'un serveur qui contiendra l'IA de l'application mobile. Ce serveur pourra fonctionner en mode question / réponse. La réponse sera produite par un réseau de neurones. Ce projet concerne précisément le développement de la partie question / réponses en langue naturelle en rapport avec le scénario du spectacle. Ce projet passera par les étapes suivantes - Etat de l'art dans la génération de texte et les systèmes question / réponse avec apprentissage profond; - Analyse de la fonctionnalité d'interaction textuelle avec l'avatar sur le téléphone mobile; - Proposition d'un modèle de construction de réponse à partir de questions de l'utilisateur et en tenant compte du scénario du spectacle; - Création d'un corpus d'apprentissage et d'un corpus de questions, pour réaliser plusieurs versions du générateur de réponses en fonction de l'évolution dans le temps de l'IA et du parcours de l'utilisateur dans le scénario; - Proposition d'une architecture pour apprendre et produire les phrases; - Expérimentations de l'apprentissage avec le corpus et évaluation des réponses aux questions. Profil attendu : - Connaissance du traitement des langues par plongement de mots (ex: BERT), ou systèmes question / réponse; - Pratique de l'apprentissage automatique appliqué au traitement de la langue; - A l'aise avec la mise en oeuvre de réseaux de neurones, et connaissance des frameworks logiciels comme pyTorch. - Facilité d'interaction avec des non informaticiens, comme un auteur, un metteur en scène, un musicien, etc.