Lieu : Sophia Antipolis et Nice Durée : 4 à 6 mois L'équipe Ressources Linguistiques du Laboratoire I3S (Université de Nice) propose le stage (rémunéré) ci-dessous. Si vous êtes intéressé(e), merci d'envoyer un CV à Jacques.Farre@unice.fr *Titre : traitement linguistique de requêtes dans des moteurs de recherche* *Sujet :* Le bon classement d'une page web dans l'ensemble des pages répondant à une requête à un moteur de recherche dépend de la pertinence des mots-clés présents dans cette page. Une étude statistique des requêtes permet de définir les mots-clés les plus intéressants. Cependant des requêtes analogues peuvent se présenter sous différentes formes, par exemple : Je cherche un appartement en location sur nice cherche location appartement Nice cherche location appartement sur nice cherch location appartament Nice (avec fautes d'orthographes) génèrent des jeux de données statistiques différents. Un traitement de ces requêtes appliquant des technologies du traitement automatique des langues naturelles (TALN) permettrait de corriger les fautes d'orthographes des requêtes, de les épurer de leurs mots fonctionnels (prépositions, articles,...) trop généraux et donc non porteurs de sens, et éventuellement de les normaliser, par exemple : (action:location; quoi:appartement;lieu:Nice-06). Cela permettrait alors de « fusionner » différentes requêtes telle que celles données ci-dessus et d'améliorer ainsi les statistiques générées. Le stage consistera à se familiariser avec une chaîne d'analyse du français et ses ressources linguistiques (lexiques, grammaires ...) puis à l'adapter pour obtenir une forme aussi normalisée que possible des requêtes. Il comprendra des visites à une PME niçoise spécialisée dans le référencement commercial sur le web.