France Telecom /Orange Labs Lannion/TECH/EASY/LN Intitulé du Stage Extraction d'informations structurées dans des documents. Mission: L'équipe Langues Naturelles de France Télécom R&D dispose d'outils de traitement automatique des textes. Le travail proposé consistera à utiliser nos outils de Traitement Automatique de la Langue Naturelle ainsi que des outils standards d'analyse de grammaires régulières (regexp, automates> ...> ) pour analyser des corpus de documents et en extraire les informations structurées. Les données récupérées seront ensuite utilisées pour des applications liées aux objectifs d'Orange Labs en traitement d'information, dans le cadre d'un projet du traitement des contenus multimédia. Profil: Bac + 5 en informatique ou Bac + 5 en TALN avec une forte compéte nce en informatique Compétences Connaissance d'un langage orienté objet Connaissance de langages de scripts (shell, python,> ...> ) Connaissance utilisateur de SQL Sensibilisation ou intérêt pour le TALN et des formalismes de type RDF Bonnes capacités d'analyse Modalités Site de France Telecom Recherche et Développement de Lannion (22) 5 mois à partir de mars ou avril 2009 Stage indemnisé sur la base de 5 mois Le plus de l'offre Les équipes de France Telecom R&D travaillent à la fois sur des problématiques de recherche très en amont, et sur l'industrialisation de solutions standard pour réaliser des services en Langage Naturel. La mission se déroule dans une équipe pluridisciplinaire composée de linguistes et d'informaticiens, autour de la technologie TiLT de traitement des langues, disposant de nombreuses ressources linguistiques et de fonctionnalités logicielles puissantes. Contacts Olivier Collin - 02 96 05 26 10 - olivier.collin@orange-ftgroup.com