Offre de Post-Doc au GREYC, Université de Caen Analyse de la structuration du discours - Projet ANR ANNODIS. Postdoctoral Fellowship in the GREYC laboratory, University of Caen Discourse Structure Analysis - ANR Project ANNODIS Contexte Le projet ANNODIS s’intègre dans un courant actuel en linguistique et en TAL qui se donne comme objet l’étude de la structuration discursive des textes : relations de discours, coréférence, organisation thématique et rhétorique... Outre l’intérêt linguistique et théorique, des retombées importantes sont attendues à terme dans des applications telles que l’analyse de contenu, la recherche d’information ou le résumé automatique. ANNODIS est un projet pluridisciplinaire regroupant l’ERSS (Toulouse 2), l’IRIT (Toulouse 1) et le GREYC (Caen). Il vise à constituer un corpus de textes annotés au niveau discursif (selon plusieurs modèles linguistiques) et à développer des outils génériques pour l’annotation et l’exploitation de ces corpus. Un des premiers résultats du projet est la réalisation d’une interface d’annotation manuelle, la plate-forme Glozz (http://www.glozz.org ). Glozz est d’ores et déjà utilisée au sein d’ANNODIS ainsi que dans plusieurs autres projets. Sujet Le sujet du contrat post-doctoral concerne l’exploitation des annotations discursives ainsi produites et la réalisation d’outils qui en facilitent l’analyse. Ces outils pourront notamment être intégrés en aval de Glozz. Diverses approches sont actuellement envisagées : méthodes statistiques et de fouille de données, visualisation, langage de requête... L’orientation précise sera discutée avec le chercheur recruté et adaptée en fonction de ses compétences et expériences antérieures. Ce dernier collaborera étroitement avec l’ensemble des membres du projet, pour la spécification des outils et la conduite des expérimentations. Qualifications requises Le chercheur recruté devra avoir soutenu une thèse en linguistique informatique et posséder une solide expérience en ingénierie logicielle. Une compétence dans le domaine de la structuration du discours, de la fouille de données ou de l’IHM serait également la bienvenue. Dates et durée : Contrat de 10 mois. Début souhaité : septembre ou octobre 2009. Adaptations possibles en fonction des disponibilités du candidat. Lieu : au GREYC, Université de Caen et CNRS (UMR 6072), au sein de l’équipe « Données, Document, Langues » (http://www.greyc.unicaen.fr/dodola/ ). Contact : Pr. Patrice Enjalbert patrice.enjalbert@info.unicaen.fr