Intitulé : Extraction d'informations sur les pratiques de mobilité La Direction Innovation et Recherche de la SNCF recherche un stagiaire pour travailler sur un projet d'étude de la mobilité des voyageurs à travers l'analyse de données textuelles. *Activités du stage* ------------------------------ Réalisation d'une plateforme d'étiquetage sémantique de données textuelles pour l'analyse des pratiques de mobilité. *Thème* ------------------------------ La société connaît depuis quelques années des changements majeurs dans les pratiques de mobilité, du fait d'autres formes d'organisation du travail, de l'émergence de nouveaux modes de transport,... Les voyageurs s'expriment sur le web social à propos leurs déplacements, aussi bien en situation normale qu'en situation perturbée. Les messages contiennent des informations sur les activités des voyageurs, leurs particularités sociologiques ou encore leurs motivations. Une analyse sémantique en fonction de tels critères est susceptible d'apporter une meilleure connaissance des comportements, des besoins et des attentes. Elle permet une compréhension nuancée et différenciée de la mobilité. Le stage aura pour objectif de contribuer à la mise en place d'une plateforme d'analyse de données pour l'extraction d'informations sur les pratiques de mobilité. *Description * ------------------------------ Le stagiaire devra : - prendre connaissance du contexte du stage (SNCF, Direction Innovation & Recherche, objectifs du stage et cadre de réalisation, situation actuelle et interlocuteurs sur les sujets concernés, ...) - faire un état de l'art des outils disponibles sur le marché en analysant leurs possibilités, leurs avantages et leurs inconvénients. - mettre en place une interface de gestion de la base de données (collecte, structuration et interface). - Définir et implémenter des méthodes pour l'étiquetage sémantique des données, en fonction d'une typologie qui lui sera préalablement spécifiée - Exploiter les résultats d'annotations et proposer des pistes d'amélioration Présentations et rapports : - présentation de début de stage à la SNCF (au bout d'un mois de stage) : contexte de stage, planning de réalisation et premiers travaux réalisés. - rapport final de stage complet comprenant : méthodologie retenue, travaux réalisés, résultats obtenus et problèmes rencontrés... 2 soutenances de fin de stage : une à l'école et une à la SNCF. Des présentations en interne SNCF ou externes pourront être effectuées. *Profil recherché* ------------------------------ Niveau : De formation Bac+5 en Traitement Automatique du Langage Naturel ou Informatique (ingénieur ou master 2). Compétences souhaitées : - Capacités d'analyse, de rédaction et de synthèse - Autonomie, qualités relationnelles, qualité de présentation (orale/écrite). - Manipulation et test des outils de TAL - Connaissances en TAL et linguistique - Bonnes compétences en informatique (programmation, gestion de bases de données) - Des connaissances en statistiques seront appréciées. Bonus : - Maîtrise d'au moins un langage de programmation (PHP de préférence) - Maitrise des expressions régulières et du SQL *Modalités du poste* ------------------------------ - Durée : 4 mois - Rémunération prévue: indemnités de stage + carte de circulation SNCF - Début : à partir de Juin 2014 - Lieu : Paris Merci d'adresser CV et lettre de motivation à Coralie Reutenauer à l'adresse mail suivante : coralie.reutenauer@sncf.fr