Stage extraction et qualification des entités nommées du Linked Open Data (f/h) ref : 0006799 | 13 nov. 2013 Orange Au service de 231 millions de clients sur les cinq continents, Orange est l'un des principaux opérateurs de télécommunications au monde. C'est aujourd'hui un opérateur intégré, fixe, mobile, internet et télévision. La recherche et l'innovation du Groupe sont portées par le réseau mondial des Orange Labs et des Technocentres. Les 5000 chercheurs, ingénieurs, concepteurs, développeurs sont répartis sur 4 continents pour être au plus près des besoins des pays. L'activité de Recherche et de Développement est l'une des sources principales de l''innovation d'Orange qui, avec près de 7500 brevets à son actif à fin 2012, contribue à développer la nouvelle génération de services de communication intégrés, innovants et simples d'utilisation. L'équipe Future Architectures and Textual Technologies d'Orange Labs a en charge des travaux de recherche et développement dans le domaine du Traitement Automatique des Langues (TAL) pour l'écrit : analyse sémantique du texte, extraction d'information, requêtes en langage naturel, bases de connaissances linguistiques. Votre rôle Sous la responsabilité d'un ingénieur de recherche, vous participez à l'amélioration des données nécessaires pour pouvoir extraire des informations du texte. Pendant le stage, - vous évaluez la pertinence des bases d'Entités Nommées (EN) du Linked Open Data (LOD, freebase, dbpedia...), - vous récupérez et fusionnez ces Entitées Nommées en recherchant les doublons (SameAs) en exploitant les connaissances existantes du LOD, - vous établissez la correspondance entre les classes des données LOD et les types et sous-types d'EN utilisés par les logiciels de l'équipe, - vous développez des algorithmes permettant de calculer un poids par défaut sur les différentes EN et d'adapter ce poids au domaine d'application vous définissez et développez le processus d'intégration de ces bases d'EN pour permettre leur mise à jour automatique et régulière. Votre profil Vous préparez une formation de niveau Bac +5 ou un Master 2 dans le domaine des technologies du langage ou du Web sémantique Vous connaissez les formats et technologies du Web Sémantique (RDF, ontologies, Linked Open Data). Vous maîtrisez Java ou Python Le plus de l'offre Vous travaillerez sur un domaine technique stimulant, au sein d'une équipe pluridisciplinaire. Contrat Stage de fin d'études Pour postuler : Consultez la page : http://orange.jobs/jobs/offer.do?joid=35860&lang=fr&wmode=light