Proposition d'emploi pour une durée d'un an. Lieu : centre CEA de Fontenay-aux-Roses Thème : annotation automatique de texte formaté But : réalisation d'un composant permettant d'identifier la structure dans des textes du type e-mails, dépêches d'agence ou contribution à des forums, etc. Il s'agit d'identifier des éléments de type auteur, date, d'isoler le contenu et de produire une version annotée du texte dans un format type XML. Le moteur développé sera paramétrable au moyen d'un formalisme donné, compatible avec une approche multilingue. On s'appuiera sur un existant présent dans le laboratoire (plate forme de traitement linguistique, automates à base de règles). Un corpus déjà annoté sera fourni pour référence. L'environnement de développement est à priori C++ sous LINUX. On appréciera les compétences du candidat en traitement automatique des langues et en techniques d'apprentissage. Géraud Canet CEA List geraud.canet@cea.fr +33 1 46 54 82 69 +33 6 59 24 36 43