Stage de master de 6 mois à la direction Innovation et Recherche SNCF, Paris 12. Intitulé : Annotation riche de données web sur les itinéraires et pratiques des voyageurs La Direction Innovation et Recherche de la SNCF recherche un stagiaire pour travailler sur un projet d'étude de la mobilité des voyageurs à travers l'analyse de données textuelles. *Activités du stage* ------------------------------ Annotation riche de données web sur les itinéraires et pratiques des voyageurs *Thème* ------------------------------ La société connaît depuis quelques années des changements majeurs dans les pratiques de mobilité, du fait d'autres formes d'organisation du travail, de l'émergence de nouveaux modes de transport, de l'impact des NTIC... Les voyageurs s'expriment sur le web social à propos de leurs déplacements, aussi bien en situation normale qu'en situation perturbée. Les messages contiennent des informations sur les activités des voyageurs, leurs particularités sociologiques ou encore leurs motivations. SNCF dispose d'un corpus de données web, d'un premier modèle de représentation des connaissances (ontologies) ainsi que d'outils facilitant l'exploration des données. Le stagiaire aura pour mission d'annoter une base d'exemples, puis d'évaluer et de proposer des améliorations du modèle de représentation des connaissances sur la base de ses observations. L'annotation visera notamment à identifier les modes de transport et autres indices relatifs à l'itinéraire parcouru, ainsi que des indices relatifs aux activités, contraintes ou ressentis du voyageur. *Description * ------------------------------ Le stagiaire devra : - prendre connaissance du contexte du stage (SNCF, Direction Innovation & Recherche, objectifs du stage et cadre de réalisation, projet dans lequel le stage s'insère et interlocuteurs sur les sujets concernés) - annoter une base de messages du web selon les thématiques et sujets spécifiés, à partir d'ontologies et taxonomies - co-construire le modèle de représentation des connaissances, à partir de ses premières annotations, de ses analyses et par interaction avec la personne actuellement en charge de la réalisation du modèle - évaluer la pertinence du modèle et la qualité de l'annotation Présentations et rapports : - présentation de début de stage à la SNCF (au bout d'un mois de stage) : contexte de stage, planning de réalisation et premiers travaux réalisés. - rapport final de stage complet comprenant : méthodologie utilisée, travaux réalisés, résultats obtenus et problèmes rencontrés 2 soutenances de fin de stage : une à l'école et une à la SNCF. Des présentations en interne SNCF ou externes pourront être effectuées. *Profil recherché* ------------------------------ Niveau : De formation Bac+5 en Sciences du langage/Traitement Automatique du Langage Naturel ou Informatique (ingénieur ou master 2). Compétences attendues : - Capacités d'analyse, de rédaction et de synthèse - Autonomie, qualités relationnelles, qualité de présentation (orale/écrite). - Connaissances en TAL et linguistique Compétences additionnelles souhaitées : - Compétences en informatique (programmation, gestion de bases de données) - Bonne connaissance du réseau de transport en Ile-de-France *Modalités du poste* ------------------------------ - Durée : 6 mois - Rémunération prévue: indemnités de stage (924 ¤ bruts mensuels) + carte de circulation SNCF sur le réseau national - Début : à partir d'avril 2016 - Lieu : Paris Merci d'adresser CV et lettre de motivation à Coralie Reutenauer et Amélie Martin aux adresses mail suivantes : coralie.reutenauer@sncf.fr, amelie.martin2@sncf.fr