Offre de stage Master 2 dans le domaine du text mining Libellé stage : Exploration, analyse, modélisation et représentation de données pour la recherche et la visualisation d'information avec Open Semantic Search et sa base Apache Lucene / Solr. Durée : 6 mois Lieux : EDF R&D Lab Saclay et déplacements sur sites industriels en France Tuteurs : Julien Kahn, Lydia Ould Ouali Contacts : julien.kahn@edf.fr et lydia.ould-ouali@edf.fr Entreprise : EDF Recherche & Développement Lab Saclay - Département PErformance et prévention des Risques Industriels du parC par la simuLation et les EtudeS (PERICLES) - groupe Facteurs Organisationnels et Humains (FOH) Adresse : 7, boulevard Gaspard Monge 91120 PALAISEAU, FRANCE Contexte industriel L'approvisionnement en énergie compte parmi les enjeux politiques, économiques et écologiques décisifs pour l'avenir. La satisfaction de la demande énergétique mondiale et le respect des objectifs internationaux de lutte contre le changement climatique imposent de développer des énergies décarbonées. Le nucléaire apparaît ainsi comme un élément du mix énergétique du futur. Dans ce domaine où l'ensemble des intervenants doit être irréprochables en matière de sûreté et de radioprotection, l'exploitant doit respecter les Règles générales d'exploitation (RGE). Les RGE sont un recueil de règles approuvées par l'Autorité de Sûreté Nucléaire qui définissent le domaine autorisé de fonctionnement de l'installation et les prescriptions de conduite associées. En effet, tel le Code de la Route, les RGE regroupent l'ensemble des consignes à respecter par les exploitants, pour garantir le meilleur niveau de sûreté de leurs centrales. Dans le cadre des réflexions associées à la transition numérique du groupe EDF, il s'agit de participer à la réflexion sur comment l'intégration d'outils « intelligents » du Traitement Automatique de la Langue (TAL) écrite peut soutenir l'utilisation des nouvelles RGE en facilitant l'analyse exhaustive et l'interprétation de ses prescriptions par les équipes de conduite de Centrales Nucléaires de Production Electrique (CNPE). Définition du stage Le stage consistera à participer à l'étude sur l'apport et les conditions de mise en oeuvre du TAL pour faciliter la consultation, l'analyse et l'interprétation des règles générales d'exploitation d'une centrale nucléaire. Plus précisément, il s'agira de: 1. Consolider et enrichir la chaine de traitement (aujourd'hui scripts python et Java) déjà constituée en l'utilisant et la faisant évoluer pour intégrer 3 chapitres supplémentaires des RGE (documents d'entrée en word) ; 2. Consolider et enrichir les modalités de recherche et de présentation des résultats au moyen du paramétrage d'Open Semantic Search ou de sa base Apache Lucene / Solr. En interface avec une équipe pluridisciplinaire (ingénieurs en Traitement Automatique de la Langue, ingénieurs Facteurs Humains et ingénieurs membres d'équipes de conduite de CNPE), l'approche développée durant le stage, consistera à : - Identifier et prioriser les modifications et enrichissement des traitements à réaliser ; - Implémenter les traitements retenus ; - Mettre à disposition d'un échantillon d'utilisateurs représentant des équipes de conduite de CNPE le prototype. Ceci afin de permettre : - Aux utilisateurs de faire des retours sur l'usage du prototype et de procéder à l'amélioration incrémentale de ce dernier ; - Au titulaire du stage et à l'équipe projet de procéder à l'amélioration incrémentale du prototype. Le recueil des retours utilisateur sera porté par les ingénieurs facteurs humains. L'analyse de ces retours sera réalisée en collaboration avec le titulaire du stage. Au terme du stage le stagiaire aura produit : - Une documentation technique (chaîne de traitement, paramétrage d'Open Semantic Search et Solr, utilisation du prototype) ; - Le transfert et la dépose du code à l'équipe projet ; - Un prototype de consultation des RGE sous Open Semantic Search. - Son rapport de stage avec une mise en perspective des développements réalisés et résultats obtenus. Les avantages du stage Au sein de la R&D du groupe EDF ce stage vous permettra : - De mettre en oeuvre des outils et techniques d'analyse de données non structurées ; - De mettre en oeuvre des techniques d'analyse et d'enrichissement de représentation des données ; - D'évoluer et interagir au sein d'une équipe pluridisciplinaire en confrontant les réalisations aux utilisateurs ; - D'être force de proposition dans les phases initiales d'un projet de R&D ; - De participer à la phase amont d'un projet industriel. Le prototype réalisé a pour ambition de nourrir une réflexion en termes de Facteurs Humains sur l'intelligibilité de système de recherche d'information et à terme d'aide à la décision à base de TAL pour les industries à risque. Compétences requises - Python, PHP - Travail en équipe - Aisance rédactionnelle - Connaissance d'outils de TAL - Aisance relationnelle - Anglais lu - Capacités d'adaptation - Capacités d'initiatives