Titre du stage M2 : Exploitation de relations sémantiques pour la Recherche d'Information Descriptif et contexte La recherche d'information sémantique (RIS) a pour but de dépasser les limites d'une recherche classique par mots-clés. Les méthodes de RIS visent à s'affranchir de ces limites via le passage à un niveau conceptuel par le biais d'une ressource sémantique. L'exploitation des ressources sémantiques se limite généralement au niveau des concepts où les mots-clés sont substitués par les concepts et où le raisonnement se fait essentiellement sur les liens hiérarchiques entre ces concepts. Ces méthodes ne permettent pas de prendre en compte toute la richesse des ressources sémantiques qui ne sont considérées que comme des structures taxonomiques. Le stage vise à enrichir un modèle de recherche d'information sémantique pour prendre en compte les relations sémantiques entre concepts afin d'améliorer la qualité des documents retournés. De nombreux travaux dans le cadre du Web Sémantique ont montré l'utilité des relations sémantiques (i.e rôles) pour améliorer l'accès à l'information [1]. Les rôles permettent d'appliquer des moteurs d'inférences et de répondre à des requêtes complexes qui nécessitent du raisonnement [2]. Plusieurs pistes sont possibles, comme l'intégration de mesures de proximité sémantique (e.g. [2]), ou exploitation des relations sémantiques pour ré-ordonnancer les résultats. Le stage se déroulera au LIPN (http ://www-lipn.univ-paris13.fr/), Université Paris 13 dans l'équipe «Représentation des Connaissances et Langage Naturel» (RCLN). Ce stage est rémunéré grâce au soutien du laboratoire d'excellence "Empirical Foundations of Linguistics" (labex EFL, http://www.labex-efl.org/). Il fait partie d'un projet plus large visant à étudier la contribution de sources de connaissances pour l'extraction d'information, mené en commun entre le LIPN et le LATTICE dans le cadre du labex EFL. Missions Les différentes étapes du travail à réaliser sont les suivantes : * État de l'art * Propositions de différents scénarios * Intégration des propositions dans une plate-forme existante (YaSemIR ou TerrierSIR développées au LIPN) * Mise en place d'une évaluation * Analyse des résultats Références [1] Claudia d'Amato, Nicola Fanizzi, Bettina Fazzinga, Georg Gottlob and Thomas Lukasiewicz. (2012) «Ontology-based semantic search on the Web and its combination with the power of inductive reasoning» In Annals of Mathematics and Artificial Intelligence. Vol. 65. No. 2/3. Pages 83-121. [2] Uren, V., Sabou, M., Motta, E., Fernandez, M., Lopez, V., Lei, Y. (2011) «Reflections on five years of evaluating semantic search systems». In International Journal of Metadata, Semantics and Ontologies, 5(2), p.87-98. [3] G. Hirst et D. St-Onge. (1998) «Lexical chains as representations of context for the detection and correction of malapropisms.» In WordNet : An electronic lexical database. MIT Press. Pages 305-332. Profil recherché - De niveau Master2 - Autonome en informatique : connaissance d'UNIX, de Java - Intérêt pour le web sémantique et la recherche d'information - La connaissance de Lucene ou Terrier est un plus Durée : 6 mois Début souhaité : avril 2013 Modalité de dépôt de candidature Merci d'envoyer un CV détaillant la formation et l'expérience acquise, les bulletins de notes ainsi qu'une lettre de motivation à : Haïfa Zargayouna (haifa.zargayouna@lipn.univ-paris13.fr) Davide Buscaldi (davide.buscaldi@lipn.univ-paris13.fr)