Proposition de stage M2 LOCALISATION DE TERMINOLOGIES Natalia Grabar (natalia.grabar@spim.jussieu.fr) Centre de Recherche des Cordeliers ; U Paris Descartes, UMR_S 872 ; INSERM, U872 eq 20 ; HEGP AP-HP CONTEXTE. L'implémentation d'outils informatiques (p. ex., pour encodage, archivage ou recherche de documents) nécessite souvent l'utilisation de terminologies représentant la connaissance du domaine. Dans certains domaines (p. ex., droit, médecine, biologie, électricité, téléphonie), il existe déjà des terminologies mais, pour leur meilleure utilisation, elles doivent être adaptées au contexte de leur exploitation. Au moins deux objectifs peuvent alors être poursuivis : (1) leur adaptation à l'application et (2) leur adaptation au domaine, plus ciblé et précis que ne le serait une terminologie généraliste. Le travail sera effectué dans le domaine de médecine. OBJECTIFS. L'objectif du stage consiste à implémenter et tester des méthodologies qui permettent d'adapter les terminologies existantes, entre autres au travers des corpus, à une question médicale précise. L'application visée concerne le filtrage et la sélection d'articles scientifiques. Le matériel principal de travail sont des mots-clés centraux pour une question, par exemple : "colorectal neoplasms" ; "liver neoplasms" ; "laparoscopy" ; "tomography, emission-computed" ; "magnetic resonance imaging" ; "tomography, x-ray computed" pour la question "diagnostic de métastases hépatiques du cancer colorectal". Ce matériel servira d'amorce pour la constitution de corpus (articles scientifiques) et de points d'entrée dans les terminologies (p.ex. l'UMLS (NLM, 2007) qui propose plus de 140 terminologies biomédicales). Le stagiaire s'intéressera à : - navigation et manipulation des arbres - outils d'acquisition (Bourigault & Jacquemin, 2000) - outils de structuration (Grabar & Hamon, 2004) des terminologies. Le développement en Perl sera demandé lors des différentes étapes du travail. DÉROULEMENT DU STAGE. Le stage sera encadré par un chercheur en informatique biomédicale et en TAL, et co-encadré par un médecin. Il s'agit d'un stage de 6 mois rémunéré. Le stage se déroulera dans l'équipe Inserm du Centre de Recherche de Cordeliers (Paris 06). Le CV et une lettre de motivation sont à envoyer à Natalia Grabar. Références BOURIGAULT, D. & JACQUEMIN, C. (2000). Construction de ressources terminologiques, In J.-M. PIERREL, Ed., Industrie des langues, pp. 215-233. GRABAR, N. & HAMON, T. (2004). Les relations dans les terminologies structurées : de la théorie à la pratique. Revue d'Intelligence Artificielle (RIA), 18(1). NLM (2007). UMLS Knowledge Sources Manual. National Library of Medicine, Bethesda, Maryland. www.nlm.nih.gov/research/umls/.