Stage : en Web sémantique Notre équipe dispose d'une Base de Connaissances alimentée par des entités nommées (EN : personnes, lieux, organisations, etc.) du Linked Open Data (dbpedia, freebase, geonames, etc.) et utilisée pour enrichir nos données pour l'extraction d'informations du texte écrit. Dans le cadre de ce stage : - vous participez à la découverte des libellés de ces EN, notamment des variantes non standards (exemple : Paris/Paname/Villes Lumières...) - vous participez à la découverte et à la correction des gentilés (St. Brieuc à briochin(e)(s)) - vous utilisez et adaptez des technologies de l'équipe ou open source pour le Traitement Automatique des Langues et les Bases de Connaissances - vous examinez des données Linked Open Data - vous vérifiez des échantillons des données découvertes - vous collaborez avec les membres de l'équipe Equipe d'accueil : L'équipe CONTENT/FAST d'Orange Labs a en charge des travaux de recherche et développement dans le domaine du Traitement Automatique des Langues (TAL) appliquée aux documents écrits et au texte issu du vocal (analyse sémantique, extraction d'information, requêtes en langage naturel, etc.), et dans le domaine des Bases de Connaissances. Profil : Master 2 en Traitement Automatique des Langues ou Informatique Contact : http://orange.jobs/jobs/offer.do?do=fiche&id=43952 Plus d'info : Johannes Heinecke (Johannes.heinecke(at)orange.com) Stage rémunéré, à Lannion, d'une durée de 5 mois à partir de mars ou avril 2015. Johannes Heinecke IMT/OLPS/OPENSERV/CONTENT/FAST computational linguist/ingénieur de recherche TALN tél. +33 (0)2 96 07 21 77