Stage recherche de Master au laboratoire ERIC (université de Lyon) Détection de métaphores dans le discours scientifique CONTEXTE La métaphore est une figure de rhétorique largement utilisée dans le langage courant (par exemple « j'y crois dur comme fer » ou « les acteurs de la politique de transport »). Elle est fondée sur l'analogie ; elle permet à un mot de recevoir, dans une phrase, un sens différent du sens courant en lui donnant le sens que l'on attribue généralement à un autre mot. La métaphore est également très utilisée dans le discours scientifique notamment en Sciences Sociales où elle est au coeur du raisonnement intellectuel. Nous pensons d'abord par des images. Cela fait de la métaphore un domaine de recherche importante non seulement en sciences du langage, en sciences cognitives mais en géographie où elle est très utilisée par les chercheurs. La détection et l'interprétation automatique de métaphores est également une tâche critique pour le traitement automatique de la langue (TAL) et l'extraction d'information. Les travaux sur la détection et la modélisation de métaphores en TAL et en intelligence artificielle ont certes commencé dans les années 80, nous fournissant une foule d'idées sur la structure et les mécanismes du phénomène. La dernière décennie a été en revanche témoin d'un saut technologique avec un nombre croissant d'approches exploitant des techniques statistiques. Par rapport aux approches plus traditionnelles issues des connaissances codées manuellement, ces méthodes plus récentes tendent à avoir une couverture plus large ; elles sont souvent moins précises mais elles sont aussi plus efficaces et robustes. Ainsi, plusieurs approches de détection de métaphores ont été proposées (Gedigian et al., 2006; Krishnakumaran and Zhu, 2007; Shutova et al., 2010) et elles reposent sur l'utilisation d'une ressource lexicale de type WordNet, TreeBank, etc. Ces ressources lexicales existent essentiellement pour l'Anglais, le Français ou l'Espagnol. Pour les autres langues, elles n'existent pas ou elles sont de moindre qualité. Yulia Tsvetkov et al., 2013 proposent alors une méthode de détection des métaphores sans utiliser de ressource lexicale. Nous nous plaçons dans un cadre récent qui est celui de l'utilisation de méthodes d'apprentissage automatique pour la détection et l'interprétation de métaphores. Dans le cadre du stage, nous nous intéressons à une science sociale particulière qui est la géographie car nous nous basons sur l'hypothèse que le raisonnement scientifique géographique s'est en grande partie construit à partir de figures de rhétorique. OBJECTIF DU STAGE Il sera demandé au stagiaire de : - réaliser un état de l'art sur les différentes méthodes de détection automatique de métaphores, - mener une étude comparative sur les outils utilisables, - finaliser la construction d'un corpus d'articles scientifiques en géographie, - tester les méthodes et outils existants sur le corpus d'articles. COMPETENCES Le sujet de stage s'adresse à des étudiants de master en informatique décisionnelle, en fouille de données, en intelligence artificielle ou en traitement automatique des langues. Des compétences en statistique, en apprentissage automatique et/ou en TAL seraient particulièrement appréciées. REFERENCES Matt Gedigian, John Bryant, Srini Narayanan, and Branimir Ciric. Catching metaphors. Proceedings of the 3rd Workshop on Scalable Natural Language Understanding, pages 41-48. 2006. Saisuresh Krishnakumaran and Xiaojin Zhu. Hunting elusive metaphors using lexical resources. Proceedings of the Workshop on Computational approaches to Figurative Language, pages 13-20. 2007 Shutova Lin Sun and Anna Korhonen. Metaphor identification using verb and noun clustering. Proceedings of the 23rd International Conference on Computational Linguistics, pages 1002-1010. 2010. Yulia Tsvetkov, Elena Mukomel, Anatole Gershman. Cross-Lingual Metaphor Detection Using Common Semantic Features. First workshop on Metaphor in NLP (Meta4NLP). 2013. INFORMATIONS COMPLEMENTAIRES Lieu : laboratoire ERIC (Lyon, France) Encadrants : Sabine Loudcher et Julien Velcin (laboratoire ERIC), Isabelle Lefort (laboratoire EVS). Durée : 4 mois à partir de mars ou avril 2016 Rémunération : 554¤ par mois Merci d'adresser votre candidature avec un CV, une lettre de motivation ainsi que vos notes de l'année universitaire en cours et de l'année dernière à Sabine Loudcher (sabine.loudcher@univ-lyon2.fr) et Julien Velcin (julien.velcin@univ-lyon2.fr)