- Sujet de Stage : Enrichissement de ressources sémantiques du domaine par des connaissances de sens commun. - Cadre du stage : Ce stage d'une durée de 5 mois se déroulera au Laboratoire d'Informatique de Paris Nord (LIPN) dans l'équipe Représentation des Connaissances et Langage Naturel (RCLN). Les travaux de l'équipe visent à articuler langage et connaissances pour améliorer les processus d'acquisition de connaissances, d'analyse textuelle, d'exploitation et d'exploration des corpus. L'encadrement sera assuré par Haïfa Zargayouna et Manel Zarrouk. Compte tenu du contexte sanitaire, des arrangements de travail à distance sont envisageables. - Contexte : Le projet BNI (Bibliothèque Numérique des Idées) [1] offre des fonctionnalités d'accès riches en exploitant des modèles sémantiques dans le domaine de la philosophie. La plateforme indexe actuellement les oeuvres de Adam Smith et Francis Hutcheson. Deux types de ressources sémantiques sont exploitées : des thésaurus et des grilles de lecture qui sont des structures arborescentes qui cartographient le champ de pensée des auteurs. - Objectifs : L'objectif du stage est l'enrichissement des ressources sémantiques produites par des connaissances générales qui permet de mettre à profit leur complémentarité. Cet enrichissement est envisagé en deux parties : - L'enrichissement statique qui consiste en l'augmentation des ressources du domaine par des entités lexicales et des relations lexico-sémantiques en voisinage direct avec les noeuds déjà existants. Pour ceci nous utiliserons le réseau lexico-sémantique JeuxDeMots (JDM) [2] comme base de connaissance générale. - L'enrichissement dynamique, qui peut s'appuyer sur des mécanismes d'inférence pour proposer automatiquement de nouvelles relations à partir de celles qui existaient déjà dans le réseau [3]. D'autres pistes sont envisagées qui intègrent l'apprentissage automatique. Les différentes étapes du travail à réaliser sont les suivantes : - Mise en place de techniques d'alignement lexical de l'état de l'art - État de l'art sur les techniques d'enrichissement de connaissances - Mise en oeuvre d'enrichissement statique - Mise en oeuvre et comparaison d'enrichissement dynamique - Évaluation des propositions dans le cadre du projet - Profil recherché : Master 2 en Informatique (orienté recherche). Bon niveau en Anglais exigé. Ce stage est proposé à des étudiants qui disposeraient d'un bon niveau académique, d'une curiosité scientifique affirmée et qui envisagent une orientation professionnelle future dans le domaine de la recherche. - Domaines techniques : Intelligence Artificielle, Traitement automatique des Langues, Ingénierie des Connaissances, Extraction d'information à partir de textes, Apprentissage automatique. - Compétences en développement : Java, Python, PHP - Début souhaité : avril/mai 2020 - Candidature : Envoi d'un CV, une lettre de motivation et des relevés des notes à manel.zarrouk@lipn.univ-paris13.fr - Références : [1] https://tal.lipn.univ-paris13.fr/bni/ [2] M. Lafourcade, N Le Brun (2020) JeuxDeMots : Un réseau lexico-sémantique pour le français, issu de jeux et d'inférences. Revue Lexique, 20 - 2020, 40 pages [3] M. Zarrouk, M. Lafourcade, A. Joubert (2014). About Inferences in a Crowdsourced Lexical-Semantic Network. In proc of 14th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2014), p 174-182.