La Direction Innovation et Recherche et la Direction Générale Sécurité de la SNCF recherchent un stagiaire pour contribuer à l'évaluation d'un moteur de recherche interne. Titre : Évaluation d'un moteur de recherche d'entreprise sur un corpus métier SNCF *Contexte* ------------------------------ Dans le cadre un programme de transformation documentaire, SNCF fait évoluer le moteur de recherche utilisé sur une base de documents métiers internes. En 2019, des travaux ont permis de faire un bilan des limites du moteur de recherche actuel, de pré-qualifier les besoins en information sur la base d'un historique de requêtes et d'identifier des critères de paramétrage du nouveau moteur. Le paramétrage de ce nouveau moteur est prévu courant 2020. Il s'accompagnera d'un protocole d'évaluation, qui nécessite de définir un jeu de requêtes de test, des métriques de pertinence et de mettre en oeuvre le protocole d'évaluation. *Description * ------------------------------ Le stagiaire devra : - Prendre connaissance du contexte du stage (SNCF, objectifs du stage et cadre de réalisation, programme de rattachement : programme PRISME et Plateau Simplification de la Direction Générale Sécurité, projet dans lequel le stage s'insère et interlocuteurs sur les sujets concernés), - Réaliser une analyse descriptive des données utilisées en entrée (corpus documentaire et historique de requêtes), par une analyse sémantique et statistique. L'analyse sera réalisée à l'aide d'outils de lexicométrie et d'outils statistiques, - Étudier les méthodes d'évaluation de moteur de recherche et leur application pratique dans le contexte du stage, - Proposer un protocole d'évaluation du moteur, à travers la définition et la construction d'un jeu de données de test, ainsi que la proposition de métriques. Présentations et rapports : - Présentation de début de stage à la SNCF (au bout d'un mois de stage) : contexte du stage, planning de réalisation et premiers travaux réalisés. - Rapport final de stage complet comprenant : méthodologie utilisée, travaux réalisés, résultats obtenus et problèmes rencontrés - 2 soutenances de fin de stage : une à l'école et une à la SNCF. - Des présentations en interne SNCF ou externes pourront être effectuées. *Profil recherché* ------------------------------ Niveau : De formation Bac+5 en Sciences du langage/Traitement Automatique du Langage Naturel ou Data Science / Statistiques. Compétences attendues : - Capacités d'analyse, de rédaction et de synthèse - Autonomie, qualités relationnelles, qualités de présentation (orale/écrite). - Connaissances en Traitement Automatique du Langage et linguistique - Compétences en statistiques Compétences additionnelles souhaitées : - Maîtrise d'outils de lexicométrie/textométrie - Maîtrise de R - Compétences en informatique (programmation) *Modalités du poste* ------------------------------ - Durée : 6 mois - Rémunération prévue : indemnités de stage + carte de circulation SNCF sur le réseau national - Début : à partir de mars 2019 - Lieu : Saint-Denis Merci d'adresser CV et lettre de motivation à Luce Lefeuvre et Coralie Reutenauer aux adresses mail suivantes : luce.lefeuvre@sncf.fr, coralie.reutenauer@sncf.fr