Stage juin-août 2021 Emvista, Montpellier (France) En collaboration avec Lamsade, CNRS, Paris-Dauphine, Paris (France) Sujet : Exploration de processus métiers dans les e-mails Mots clés : Natural Language Processing, Process Mining Les e-mails contiennent de nombreuses informations dans les méta-données et dans le corps des messages : qui est en relation avec qui, quelles activités sont entreprises, son numéro de téléphone, sa fonction, émotions véhiculées dans le message, une prise de rendez-vous, etc. Ces informations sont d'un grand intérêt pour l'opérationnalisation au quotidien, en particulier des sociétés. Ce stage a pour objectif de développer un système prototypique démontrant les capacités des outils actuels à explorer les processus métiers dans un grand volume d'e-mails. Le développement d'un tel système s'appuiera sur : 1. des outils disponibles en Traitement Automatique du Langage Naturel. Entre autres, les outils de Emvista, particulièrement l'analyseur sémantique, devront être expérimentés au sein dudit système ; 2. des outils mis à disposition par la communauté de Process Mining : les outils libres disponibles dans le framework Prom (https://www.promtools.org/doku.php), la bibliothèque Process Mining for Pyton (PM4Py), ... Le système sera appliqué sur des e-mails en français et en anglais mis à disposition dans le cadre de ce stage. Le candidat s'attachera également à identifier les verrous scientifiques et techniques restant à lever en fin de stage pour obtenir des résultats de qualité. Le candidat retenu devrait avoir des compétences pour manipuler les outils de NLP et/ou de Process Mining (idéalement les deux) et être en capacité de développer un prototype. Informations complémentaires Profil recherché : Etudiant(e) en Licence 3 Informatique ou Master Informatique. Unité d'accueil : - de préférence Emvista (groupe India Juliet), Cap Oméga, Rpt Benjamin Franklin, CS 39521, Montpellier, France - Lamsade, Université Paris Dauphine PSL, Place du Maréchal de Lattre de Tassigny, 75775 Paris Mode : télétravail possible. Encadrants et contacts : - Cédric Lopez (PhD. NLP), directeur de recherche chez Emvista cedric.lopez@emvista.com - Daniela Grigori (Prof. Process Mining), directrice du Lamsade daniela.grigori@lamsade.dauphine.fr Pièces demandées : un CV et les derniers relevés de notes. À propos de Emvista Emvista est un éditeur de logiciels qui visent à analyser les contenus textuels par une intelligence artificielle s'appuyant sur des connaissances linguistiques et ontologiques. En particulier, Emvista développe Prevyo, un assistant virtuel intelligent de gestion d'e-mails. Prevyo est en mesure de générer des actions que l'utilisateur doit entreprendre, en fonction de leur priorité et importance, de détecter des événements à intégrer dans l'agenda, ou encore de mettre en avant des actions non réalisées (par exemple la non réception d'une facture en temps voulu). Pour ce faire, Prevyo applique une analyse sémantique qui s'appuie sur de nombreuses briques technologiques telles que la reconnaissance d'expressions temporelles, la reconnaissance d'entités nommées, ou encore l'extraction d'événements. Ces informations sont représentées sous forme ontologique à partir de laquelle un raisonnement automatique est en mesure de faire apparaître des connaissances qui n'apparaissaient pas au premier abord. À propos du Lamsade Le LAMSADE (Laboratoire d'Analyse et de Modélisation de Systèmes d'Aide à la Décision) - UMR CNRS 7243 a été établi en 1974. Les thèmes de recherches originels de l'Aide à la décision et de la Recherche Opérationnelle ont ensuite été complétés par l'Informatique Décisionnelle, la Théorie de la Décision, la Science des Données et l'Intelligence Artificielle. Le LAMSADE propose des solutions pour la conception, l'utilisation et la validation de modèles formels d'Aide à la Décision. Daniela Grigori est spécialiste dans le domaine du Process Mining et de la BPM (Business Process management). Elle est co-auteure d'un livre sur les méthodes d'analyse des données de processus et membre du comité de programme de la conférence internationale dans ce domaine (ICPM). Elle a publié plusieurs articles sur l'analyse des emails pour extraire les informations relatives au processus. Cédric LOPEZ - Directeur de recherche cedric.lopez@emvista.com +33 434 480 479 / +33 672 642 577 *Emvista *- www.emvista.com Cap Oméga - Rond-point Benjamin Franklin CS 39521 - 34960 Montpellier Cedex 02 - France