Poste : Stage détection et formalisation des intentions dans les emails Réf. : Stage-2018-AssistantEmailIntentionDetection Contrat : Stage de Fin d'études Date de démarrage : ASAP (durée 6 mois) Mots-clés : Intention dans les emails, Traitement Automatique des Langues, Sémantique Grâce à la compétence technique et l'engagement de ses 160 collaborateurs, LINAGORA est aujourd'hui le leader français sur le marché très porteur du Logiciel Libre. Nos clients sont en majorité des grands comptes, public et privé. Notre métier : - L'édition de logiciels Open-Source innovants et répondant aux besoins actuels et futurs du marché (bureau virtuel, assistant intelligent pour l'entreprise, middleware SOA, sécurité, gestion des identités). - La prestation de services pour accompagner les grands projets Open-Source : conseil, intégration/développement, maintenance, formation des utilisateurs. Linagora est présent en France (Paris, Marseille, Toulouse, Lyon) au Vietnam (Hanoï), Quebec et Tunisie (Tunis). Linagora participe à diférent projets de recherche Européens H2020 (C2Net) et Français / PSPC (OpenPaaS). Nos principaux axes de recherche concernent la reconnaissance et la compréhension de la parole, le « text mining », les architectures middleware distribuées, le Cloud Computing, l'ingénierie collaborative, la sécurité, les architectures Big-Data et les communautés open-source. CONTEXTE La société Linagora (http://linagora.com) propose dans le cadre de son projet de recherche Open-PaaS:NG des outils open-source innovants pour améliorer le travail collaboratif en entreprise. La plate-forme OpenPaaS (http://open-paas.org) est un outil de travail collaboratif proposant plusieurs services tels que : gestion des mails et des agendas partagés, édition collaborative temps-réel de documents, chat et réseau social d'entreprise. Dans ce contexte, nous nous intéressons au module de gestion des mails. Nous voulons enrichir ce module avec des fonctionnalités de recommandations à l'utilisateur qui s'appuient sur des techniques sémantiques et des techniques de machine learning. MISSION Vous serez intégré au Linagora Labs (https://research.linagora.com) au sein d'une équipe de recherche pluridisciplinaire à forte composante Intelligence Artifcielle, pour améliorer un module d'identifcation et de formalisation des intentions dans les emails. Une intention est le but véhiculé par le mail. Nous nous focaliserons sur : 1. l'identifcation et la formalisation des intentions dans des échanges emails répétitifs (comme la prise de rdv, les échanges de pièces jointes, l'envoi de candidatures, les appels d'ofres, etc.). 2. Pour chaque intention identifée, la ou les canevas des réponses nécessaires pour répondre à l'intention. Plus précisément, Linagora a développé un module smart reply (https://ci.linagora.com/zsellami/automatic-email-answering) permettant de proposer des réponses aux emails de RDV. L'identifcation des intentions s'appuie sur une approche symbolique qui consiste à rechercher dans le texte des éléments linguistiques (verbes, syntagmes nominaux, entités nommées) qui manifeste un RDV. La formalisation de ces intentions est intégrée dans une ontologie en utilisant les principes du formalisme FrameNet (http://asfalda.linguist.univ-paris-diderot.fr/frameIndex.xml). La notion principale de FrameNet est le cadre conceptuel (Frame). Dans notre cas, un Frame correspondra a une intention. Chaque Frame comportera : 1. des unités lexicales qui indique la présence d'une intention dans un mail ou un sous-ensemble de phrases dans le mail (exemple, propose un rdv, convenir à un rdv, changer de date de réunion, etc.) 2. des rôles à instancier dans le Frame. Par exemple, pour un Frame de suggestion de disponibilités, les dates/heures auront le rôle créneau dans ce Frame. PROFIL Vous êtes issu d'une formation supérieure bac+5 et êtes en recherche d'un stage de fn d'étude. Vous disposez de : 1. Bonnes compétences en linguistique et en analyses de corpus textuels. 2. Bonnes compétences en programmation Python ou Java. 3. Bonnes connaissances et compétences en Traitement Automatique des Langues. La maîtrise d'un ou de plusieurs dependency parser (comme core nlp, spacy python, GATE, etc.) et extracteurs d'entités nommées (comme Gate, DBPedia spotlight, Duckling Facebook, etc.) serait un plus ; Vous saurez vous montrer passionné, rigoureux ainsi que faire preuve d'autonomie. Vous avez un goût certain pour la découverte et l'expérimentation, vous êtes force de proposition et êtes capable d'argumenter vos choix techniques. Vous partagez notre choix de privilégier des logiciels libres et de contribuer aux communautés d'utilisateurs (listes, FAQ, HOWTO). INFORMATIONS PRATIQUES Contacts Zied Sellami ou Jean-Pierre Lorré zsellami@linagora.com, jplorre@linagora.com Lieu du stage - Durée Toulouse - 6 mois Société Linagora Website : https://research.linagora.com / Twitter : @LinagoraLabs