Proposition de stage de Post-doctorat pour 2010 pour une durée d'un an renouvelable. Dans le cadre du projet Kodex financé par le programme Quaero (http://www.quaero.org) nous recherchons un chercheur post-doctorant ayant le profil suivant : * Nécessaire : - Bon niveau en informatique - Bon niveau en recherche d'information - Compétences techniques : environnement linux, développement Java, Python, HTML, CSS, javascript, XML, utilisation svn. * Les plus : - Formation en traitement automatique des langues * Rémunération: entre 2000^E et 3000^E net mensuel (suivant l'expérience depuis la thèse) ; * Financement : projet Kodex financé par le programme Quaero ; * Lieux du Stage : Toulouse IRIT (Institut de Recherche en Informatique de Toulouse) ; * Début du stage : le plus tôt possible ; * Durée du stage : un an à partir de la date d'embauche (renouvelable) ; * Encadrement du stage : Bruno Gaume ; * Contact : gaume@irit.fr ; * Contexte scientifique : Les résultats produits par un moteur de recherche sont en deçà des attentes de 85% des utilisateurs exploitant un moteur de recherche lors de leurs activités quotidiennes. Les raisons évoquées sont essentiellement l'incompréhensibilité et l'ambiguïté des informations retournées à leurs requêtes engendrant ainsi des phénomènes fort connus de désorientation de l'utilisateur et de surcharge informationnelle. Quand un moteur de recherche reçoit une requête, cette requête est souvent polysémique au sens ou des communautés différentes peuvent entretenir des rapports différents avec cette requête d'où des attentes différentes selon les intentions de l'utilisateur. Plutôt que de mélanger la présentation des résultats des documents, concernant ces différentes communautés, il conviendrait de faire connaître à l'utilisateur l'existence de ces multiples points de vue sur sa requête (mesurées par une analyse structurelle de la base documentaire interrogée). En s'intégrant dans une équipe pluridisciplinaire, il s'agira pour le post-doc de développer des méthodes et de les implémenter pour construire Kodex un moteur de recherche permettant de mieux identifier l'information pertinente en levant les éventuelles ambiguïtés et mieux répondre à l'incompréhensibilité des résultats de recherche. Pour cela les résultats d'une requête seront organisés de manière thématique sous la forme de nuages de mots, chaque nuage identifiant un ensemble de pages thématiquement proches, ce qui permettra à l'utilisateur de cibler sa recherche bien plus efficacement en affinant sa requête selon les points de vue ainsi identifiés par chaque nuage de mots. Le moteur Kodex sera évalué par la projet T.2.6 du programme Quaero sur la plateforme OSIRIM (https://osirim.irit.fr/static.php?op=quaero.html), ce qui facilitera la mise au point et la rédaction d'articles dans le domaine de la recherche d'information.