Offre de Post-Doc au CEA LIST, Fontenay-aux-Roses. Sujet : Constitution automatique d’une ressource structurée d’informations géographiques à large échelle pour la recherche d’images touristiques sur le Web (projet ANR GEORAMA). Période : 12 mois, mi 2009 -> mi 2010 Contexte : Ce post-doctorat de 12 mois, s’inscrit dans le cadre du projet ANR GEORAMA (CEA LIST + EXALEAD + Telecom Bretagne) dont l'objectif est l'amélioration de la recherche d’images géographiques sur le Web (monuments, sites touristiques etc.) par la création et l’exploitation de ressources structurées à large échelle et de méthodes d’analyse et de recherche d’images par le contenu. Le post-doctorat se fera en région parisienne au sein du CEA LIST (Fontenay-Aux-Roses) dans le Laboratoire d’Ingénierie de la Connaissance Multimédia Multilingue (LIC2M) spécialisé dans l’indexation, le filtrage et la recherche d’information multimédia. Objectifs : À partir de données brutes provenant de sources hétérogènes du Web (Geonames, Wikipedia, Flickr, Panoramio...), le premier objectif du post-doctorant sera d’extraire et de structurer de façon automatique des connaissances géographiques au sein d’une ressource linguistique à large échelle adaptée à la recherche d’images d’entités géographiques. On extraira en priorité : le nom des entités géographique (Le Louvre) son type (Musée), des informations d’inclusion spatiales (Paris, France), ses coordonnées géographiques (couple longitude, latitude). S’agissant d’une application de recherche d’informations, des stratégies de ranking des données seront à étudier. Dans un deuxième temps, l’utilisation de cette ressource portera principalement sur la reformulation des requêtes utilisateurs, l’amélioration de la navigation dans l’espace des résultats et la présentation des résultats (on disposera d’informations textuelles, d’images et d’un service cartographique de type Yahoo Map). Profils recherchés: Doctorat Compétences en traitement automatique des langues, recherche et extraction d’information. Des connaissances en traitement d’images seraient un +. Compétences informatiques : C/C++, scripts (Perl ou autres). Compétences en bases de données (SQL/MySQL) seraient un +. Date limite de candidature : 18/02/2009 Candidature : Envoi d’un email à pierre-alain.moellic@cea.fr ET romaric.besancon@cea.fr avec motivations et un CV détaillé (pdf).