Poste de Post-Doctorat Selection de caractéristiques pour l'analyse de données en contexte Le laboratoire L3i, EA 2118, dans le cadre du projet Tourinflux, lance un appel à candidatures pour un poste de post-doctorant en informatique dans le domaine de l'analyse d'évènement touristiques spatio-temporelles. *Durée :* 12 mois (une extension de 12 mois est envisageable) *Date d'embauche :* 1er novembre 2013 *Salaire :* 2100 ¤ net / mois *Lieu de travail :* dans les locaux du L3i à La Rochelle *Spécialité :* Informatique *Mots-clés :* Analyse de données, Evènements spatiaux temporels, inférence, Modélisation d'occurrence temporelle, Semantic Web, Ingénierie des connaissances, Logiques de Description, E-tourisme, Normalisation (TimeML, TourInFrance) Description du projet et du poste : Les travaux menés par le candidat se dérouleront au sein du L3i et s'inscriront dans le projet Tourinflux. Le laboratoire L3i, EA 2118 créé en 1993, représente la seule et unique composante de recherche du domaine STIC sur l'Université de la Rochelle associant très efficacement les chercheurs de l'IUT de la Rochelle, et du Pôle Sciences en informatique. Dans le cadre de la politique quadriennale (désormais quinquennale) de l'université de la Rochelle, le L3i vient d'être évalué A par l'AERES. Le laboratoire Informatique, Image et Interaction a choisi d'axer son projet de laboratoire autour de deux thèmes (Axes Thématiques) que sont « Image, Document et Données Complexes » et « Systèmes Interactifs et Images », véritables c½urs de métier du laboratoire. Par ailleurs, le laboratoire propose de mettre en avant ASPIC (Axe Stratégique Pertinence Intraction/Contenus), vecteur de visibilité de son action scientifique au sein de projets structurants et en articulation avec le monde socio-économique. Ainsi, plus d'une dizaine de projets sont actuellement menés autour de l'analyse de documents et de données complexes d'une part (en lien avec le centre européen de valorisation des contenus numériques - Valconum), et autour de l'interaction appliquée aux jeux vidéos et l'e-Education d'autre part. De part ses activités de ces six dernières années, le L3i a développé des outils et des compétences dans l'analyse de données récurrentes dans le temps et l'espace, mais également l'analyse de contenus et de données complexes et hétérogènes. Le projet Tourinflux, sélectionnée dans le cadre de l'appel à projets Big Data du Fonds National pour la Société Numérique et financé dans le programme d'investissements d'avenir, rassemble deux entreprises, une association d'entreprises et le laboratoire L3i, et sera réalisé en partenariat avec plusieurs acteurs du tourisme de France. Ce projet vise à apporter aux acteurs du tourisme (d'abord les institutionnels mais aussi les acteurs privés) un ensemble d'outils leur permettant de gérer à la fois leurs données internes et les informations disponibles sur le web afin de mieux comprendre comment un territoire est perçu et de mieux agir sur cette perception. Les outils actuellement à disposition des institutionnels du tourisme sont insuffisants pour répondre à ce besoin du fait des problèmes de collecte, d'analyse, de manipulation et d'échange d'informations réalisés de manière beaucoup trop artisanale. L'objectif de Tourinflux est de proposer un tableau de bord complet permettant aux institutionnels du tourisme, quelle que soit leur taille, de visualiser et interpréter l'information disponible par rapport à leur territoire (aux niveaux micro et macro) afin de prendre les décisions les plus efficaces. Plus spécifiquement, le candidat retenu travaillera sur l'analyse d'objets touristiques (hôtels, festivals, etc) afin de déterminer des caractéristiques minimales de ces objets pour des profils d'utilisateurs. L'objectif de ce travail sera de mettre un place une stratégie de *recherche d'information* adaptée aux besoins des *professionnels du tourisme*. L'efficacité d'une telle approche repose sur une *structuration sémantique*de l' *information touristique* : 1) Structuration sémantique et semi-automatique de l'information touristique. Les informations touristiques sont des informations à la fois hétérogènes (textes libres, pages web, photos, ...) et semi-structurées. La structuration de l'information est un défi majeur à l'heure où la masse d'information non structurée est en évolution constante, que ce soit sur le web où dans les organisations. Les processus classiques de structuration de l'information sont des processus manuels ou semi-automatique, fortement dépendant du domaine et de sa sémantique. Le premier objectif de ce travail sera de mettre en place un processus semi-automatique de structuration de l'information touristique. Deux verrous scientifiques ont été identifiés : - Adapter les techniques de traitement automatique de la langue au vocabulaire spécifique de l'information touristique pour extraire les termes caractéristiques du domaine - Modéliser la sémantique du domaine qui s'organise naturellement sous une forme hiérarchique (thesaurus ou ontologie) 2) Recherche d'information adaptée aux besoins des professionnels du tourisme Dans un processus classique de recherche d'information par requête, l'utilisateur peut affiner sa recherche en modifiant sa requête initiale. D'autres stratégies proposent à l'utilisateur une recherche d'information par navigation dans une structuration a priori des données (arborescence de fichiers, liens html, ....). Il existe des mécanismes de recherche d'information dit « par facettes », à la fois par requête et par navigation, permettant à l'utilisateur d'exprimer une requête, puis de l'affiner par navigation. De tels mécanismes favorisent le raffinement des requêtes, et nous semblent particulièrement adaptés aux professionnels du tourisme pour une recherche rapide et efficace. Le second objectif de ce travail sera double : - Déterminer les caractéristiques minimales de chaque objet touristique pour un accès plus rapide à l'information. Deux approches sont envisageables : une approche statistique, et une approche logique. - Mettre en place un prototype de recherche d'information par facettes adaptée aux besoins des professionnels du tourisme. Qualifications Les candidats au poste devront être titulaires d'un doctorat en informatique, avec des compétences en représentation des connaissances et fouille de données. Une expérience de recherche dans au moins deux des quatre domaines suivants est également demandée : - Traitement Automatique des Langues, Fouille de texte - Connaissances en BigData et entrepôts de données (Hadoop, autre) - Modélisation, Ontologie et moteur d'inférence - Annotation et évaluation - Ecriture de grammaires d'extraction** - Maitriser un ou plusieurs langages de programmation (Python, C/C++, java, ...) Postuler Les candidats au poste devront envoyer un CV, un énoncé des intérêts de recherche, et les noms et coordonnées d'au moins trois références (adresses mail comprises) à : mickael.coustaty@univ-lr.fr ; jean-marc.ogier@univ-lr.fr