Stage ingénieur ou M2 : fouille de textes appliquée à des documents métiers SNCF Contexte : SNCF dispose actuellement d'une base documentaire de référentiels métiers. La Direction Innovation et Recherche souhaite appliquer des méthodes de fouille de texte pour améliorer la gestion des documents, l'accès aux contenus et la navigation dans cette base documentaire. Activités du stage : Le stagiaire devra : - prendre connaissance du contexte du stage (SNCF, Direction Innovation & Recherche, objectifs du stage et cadre de réalisation) - Préparer les données en vue de leur réutilisation dans différents outils (adapter le format, structurer les contenus) - Appliquer des traitements de data et text mining pour classer, visualiser et enrichir les documents. Présentations et rapports : - Présentation de début de stage à la SNCF (au bout d'un mois de stage) : contexte de stage, planning de réalisation et premiers travaux réalisés. - Rapport final de stage complet comprenant : méthodologie utilisée, travaux réalisés, résultats obtenus et problèmes rencontrés 2 soutenances de fin de stage : une à l'école et une à la SNCF. Des présentations en interne SNCF ou externes pourront être effectuées. Profil souhaité : Niveau : dernière année d'école d'ingénieur ou M2 en traitement automatique des langues ou en informatique spécialisé en ingénierie des connaissances ou fouilles de données (text mining). Compétences requises : - Traitement automatique des langues - Apprentissage statistique / Machine learning - Maîtrise de R - Développement informatique (Java, Python...) - Autonomie - Capacités d'analyse, de rédaction, de synthèse Horaires : 35 h hebdomadaires Lieu de travail : Paris 12ème Durée : 6 mois Date de début : à partir du 20/02/2016 Rémunération prévue : indemnités de stage (924 ¤ bruts mensuels) + carte de circulation sur le réseau national Veuillez adresser votre CV et lettre de motivation à coralie.reutenauer@sncf.fr