Offre de Post-Doc a l'IRIT, Universite de Toulouse 3. Sujet : Analyse automatique de discours. Période : 12 mois, septembre 2009 -> aout 2010 Contexte : Ce post-doctorat de 12 mois, s'inscrit dans le cadre du projet ANR ANNODIS, impliquant l'IRIT (Université de Toulouse 3), CLLE (Université de Toulouse 2), le GREYC Université de Caen) dont l'objectif est la constitution d'un corpus en français annoté de structure discursive à plusieurs niveaux et le développement d'outils automatiques et semi-automatiques pour accomplir la tâche. Le post-doctorat se fera en région Midi-Pyrenées au sein du laboratoire IRIT à l'université de Toulouse 3, Toulouse, dans l'équipe Lilac sous la direction de Nicholas Asher. Objectifs : À partir de données provenant de la campagne d'annotation manuelle du corpus, le premier objectif du post-doctorant sera de monter des expérimentations d'extraction automatique de la structure discursive d'un texte, et d'évaluer la faisabilité de méthodes d'apprentissage automatique supervisé ou semi-supervisé à partir du corpus. Une structure discursive est considérée comme un graphe où les noeuds sont des segments de texte et les liens sont des relations discursives ou rhétoriques. Il s'agit alors de trois tâches plus ou moins indépendantes: 1) déterminer les segments, 2) déterminer les points d'attachement des segments et 3) déterminer la relation entre les segments attachés. Le post-doctorant sera chargé aussi de superviser la fin de la collecte des données annotées manuellement. Profils recherchés: - Doctorat - Compétences en traitement automatique des langues et/ou extraction d'information, et techniques d'apprentissage automatiques. - Connaissance du domaine des théories du discours un plus. Rémunération: 3000 par mois Candidature : Envoi d'un email à ET avec motivations et un CV détaillé (pdf). Postdoctoral Fellowship at the Institut de Recherche en Informatique de Toulouse (IRIT) Université de Toulouse 3. Subject : Applying learning techniques to discourse analysis Période : 12 months, September 2009 -> August 2010 Context : This postdoctoral fellowship, is part of the ANR project ANNODIS, which includes the labs: IRIT (Université de Toulouse 3), CLLE (Université de Toulouse 2), and GREYC Université de Caen). The goal of this project is to build a corpus of French texts annotated with discourse structure at several levels. The project also has the goal of providing automatic and semi-automatic tools for helping with this task. The postdoctoral fellow will be a member of the IRIT lab at l'université de Toulouse 3, Toulouse, in the research group Lilac under the direction of Nicholas Asher. Objectives : Based on the data culled from the manual annotation of our corpus, the first objective of the postdoctoral fellow will be to design and supervise experiments for the automatic recovery of the discourse structure of a text and to evaluate the feasibility of semi supervised and supervised learning strategies given the data in the corpus. A discourse structure is a graph where the nodes are text segments and the arcs are discourse relations. Thus, the extraction task has three stages: 1) finding the segments, 2) determining the attachment points for segments in the graph et 3) determining the discourse relation or relations between the attached segments. The postdoctoral fellow will also be in charge of the final collection and organization of the manual annotation data. Candidate should have: - a Ph.D. - competence in NLP and/or information extraction, and automated learning methods. A familiarity with theories of discourse structure would be a Plus. Salary: 3000 euro per month