Type d'emploi : Post-doc / CDD recherche Durée du contrat : un an Début : autour de septembre 2011 Lieu : LIMSI/CNRS (Orsay) Projet de recherche ANR ChronoLines Plus de détails sur http://www.limsi.fr/Individu/xtannier/fr/Stages/post_doc_2011_chronolines_analyse.html --------------- Contexte : Entre autres objectifs, le projet ANR ChronoLines a pour but de créer de façon semi-automatique des chronologies à partir de dépêches d'agences. Étant donnés un thème fourni par l'utilisateur et un ensemble de textes, il s'agit de retrouver dans les documents les événements les plus importants concernant ce thème, puis de les ordonner et de les présenter à l'utilisateur pour validation. Par exemple, pour une demande sur un nom de personne (/Claude Chabrol/), le système devra retracer les événements marquants de sa vie. Pour les négociations de paix au Moyen-Orient, les principales dates importantes s'y rattachant. Les partenaires impliqués dans le projet ChronoLines sont l'AFP, le MoDyCo, le centre de recherche de Xerox à Grenoble, Exalead et le LIMSI. De nombreuses étapes sont nécessaires pour parvenir à ce résultat. Parmi ces étapes, les documents concernant le thème attendu doivent être collectés, puis les événements décrits dans les textes doivent être identifiés et placés sur l'axe des temps, dans la mesure du possible. L'analyse des expressions temporelles et de la structure syntaxique des phrases apporteront des indices importants de ce point de vue. Lorsque le positionnement absolu et non ambigu des événements sur l'axe des temps est impossible, il est parfois possible de déterminer des relations temporelles relatives entre les événements, ou entre un événement et une date. Ces informations sont également très importantes, dans l'optique de la composition d'une chronologie thématique pertinente. Par la suite, les étapes suivantes consistent à organiser l'information pertinente pour l'organiser dans une chronologie claire et consise, et donc de sélectionner les événements les plus importants pour le thème. --------------- Activité du post-doc : La personne recrutée sera pleinement intégrée au projet ChronoLines, et devra collaborer de façon étroite et coordonnée avec les autres partenaires du projet. Elle sera particulièrement concernée par les étapes de normalisation des expressions temporelles, du lien entre les événements et les expressions temporelles, et de l'ordonnancement de ces éléments entre eux dans les textes. Un travail sur l'aspect multi-document du projet pourra également être débuté. Les techniques mises en œuvre proviendront aussi bien de la recherche d'information que du traitement automatique des langues, en particulier de l'extraction d'information. Nous utiliserons des moteurs de recherche, ainsi que des outils d'analyse syntaxique. Les langues de travail pourront être le français ou l'anglais. --------------- Profil recherché : - Doctorat dans le domaine du traitement automatique des langues - Bonnes connaissances en analyse syntaxique, extraction d'information et en recherche d'information - Maîtrise de Linux et de Java - Bonne maîtrise du français et de l'anglais --------------- Contacts : Véronique Moriceau (moriceau@limsi.fr) Xavier Tannier (xtannier@limsi.fr)