------------------------------------------------------------------------ Offre de stage M2 en TAL à Syllabs (Paris) ------------------------------------------------------------------------ ------------------------------------------------------------------------ Caractérisation des objets touristiques pour l'extraction de facettes dans le tourisme ------------------------------------------------------------------------ Syllabs travaille depuis un certain temps sur des outils de TAL appliqués au tourisme, que ce soit dans un contexte de web mining, de text mining ou de production de contenus.Dans le cadre de Tourinflux, projet de recherche multi-partenaire en cours, Syllabs doit produire des bases de connaissances se rapportant à des objets touristiques (hôtels, etc.). Ce projet vise à apporter aux acteurs du tourisme (d'abord les institutionnels mais aussi les acteurs privés) un ensemble d'outils leur permettant de gérer à la fois leurs données internes et les informations disponibles sur le web afin de mieux comprendre comment un territoire est perçu et de mieux agir sur cette perception. C'est dans ce contexte que se situe le stage. Celui-ci comporte plusieurs étapes et objectifs. La durée du stage ne permettra peut-être pas de tout couvrir. ---------------------------- Descriptif du stage ---------------------------- 1) Modélisation d'une base de connaissances des objets touristiques - Créer une taxonomie (simple) des différents objets touristiques et étudier les facettes communes à plusieurs objets. - Déterminer les facettes utilisables pour la génération automatique des descriptifs - Déterminer les facettes nécessaires pour l'analyse d'avis d'internautes 2) Extraction des facettes via LOL (outil dédié à base de règles linguistiques) - Extraction des facettes présents dans les "descriptifs marchands" - Extraction des facettes présents dans les "avis internautes" 3) Création de la base à partir de la sortie d'extraction - Créer une base de données à partir de la sortie d'extraction, manipulation des objets extraits 4) Génération de descriptifs d'objets touristiques - écrire des règles de génération pour 2 objets touristiques différents en fonction de la base obtenue ------------------------ Profil souhaité ------------------------ - Aptitude pour la représentation formelle du langage. - Excellente capacité de communication et aptitude pour le travail d'équipe. - Bon niveau en python serait un plus. - Excellentes qualités rédactionnelles, goût pour l'écriture. Formation en cours : Linguistique Informatique, TAL ou similaire. Durée du stage : 6 mois (début entre janvier et avril, en fonction du cursus universitaire) Merci d'envoyer votre candidature à l'adresse jobs@syllabs.com en indiquant dans l'objet du mél « Stage TAL ». Lieu : Syllabs, 26 rue Notre Dame de Nazareth, 75003 Paris. Contrat : stage conventionné rémunéré en fonction du niveau d'étude.