STAGE INGÉNIERIE LINGUISTIQUE SUJET 2019: Exploration, analyse, modélisation et représentation de données semi-structurées à des fins d'utilisation pour la recherche et la visualisation d'information. DURÉE : 6 MOIS ENVIRON Lieux : EDF R&D Lab Saclay et déplacements sur sites industriels en France ------------------------------------------------------------------ 1. CONTEXTE INDUSTRIEL ------------------------------------------------------------------ L'approvisionnement en énergie compte parmi les enjeux politiques, économiques et écologiques décisifs pour l'avenir. La satisfaction de la demande énergétique mondiale et le respect des objectifs internationaux de lutte contre le changement climatique imposent de développer des énergies décarbonées. Le nucléaire apparaît ainsi comme un élément du mix énergétique du futur. Dans ce domaine où l'ensemble des intervenants doit être irréprochables en matière de sûreté et de radioprotection, l'exploitant doit respecter les Règles générales d'exploitation (RGE). Les RGE sont un recueil de règles approuvées par l'Autorité de Sûreté Nucléaire qui définissent le domaine autorisé de fonctionnement de l'installation et les prescriptions de conduite associées. En effet, tel le Code de la Route, les RGE regroupent l'ensemble des consignes à respecter par les exploitants, pour garantir le meilleur niveau de sûreté de leurs centrales. Dans le cadre des réflexions associées à la transition numérique du groupe EDF il s'agit d'instruire comment l'intégration d'outils « intelligents » du Traitement Automatique de la Langue Naturelle écrite pourrait soutenir l'utilisation des nouvelles RGE en facilitant l'analyse exhaustive et l'interprétation de ses prescriptions par les différentes fonctions concernées. ------------------------------------------------------------------ 2. SUJET DU STAGE ------------------------------------------------------------------ Le stage consistera à participer à l'étude sur l'apport des TALN pour faciliter la consultation, l'analyse et l'interprétation des règles générales d'exploitation d'une centrale nucléaire. Plus précisément, il s'agira de: - Participer à l'analyse du besoin et s'approprier le use case retenu ; - pré traitement : mettre sous forme exploitable pour des analyses et traitements automatiques, un document rédigé en français en chapitres et sous-chapitres - Exploration des données (analyses statistiques ou linguistiques) - Résoudre le use case - Constituer les ressources - Formater les données ; - Proposer des représentations, parcours, réponses compte tenu du use case retenu - Evaluer les propositions retenues. Au terme du stage le stagiaire pourra proposer : - Une documentation technique - Le transfert et dépôt du code à l'équipe - Un ou des prototypes des différentes propositions étudiées. Il s'agira ensuite de mettre en perspective les éléments issus de ces différentes propositions compte tenu des besoins, traitements et environnements techniques identifiés. *** Les avantages du stage Au sein de la R&D du groupe EDF ce stage vous permettra : - De mettre en oeuvre des outils d'analyse de données non structurées ; - De mettre en oeuvre des outils d'analyse et de représentation de données semi structurées ; - D'interagir avec des experts en text mining et ergonomie ; - D'être force de proposition dans un projet pluridisciplinaire dès les phases amonts de conception ; - De participer à la phase amont d'un projet industriel. ------------------------------------------------------------------ 3. COMPETENCES REQUISES ------------------------------------------------------------------ Connaissance du langage python Connaissance d'outils de TALN Travail en équipe Aisance relationnelle Aisance rédactionnelle Capacités d'adaptation et d'initiatives Anglais lu ------------------------------------------------------------------ 4. INFORMATIONS PRATIQUES ------------------------------------------------------------------ 1 - CONTACTS Julien Kahn (Tuteur) julien.kahn@edf.fr Delphine Lagarde delphine.lagarde@edf.fr Meryl Bothua meryl.bothua@edf.fr 2 - Lieu du stage EDF R&D Lab Saclay Département PErformance et prévention des Risques Industriels du parC par la simuLation et les EtudeS (PERICLES) Groupe Facteurs Organisationnels et Humains (FOH) 7, boulevard Gaspard Monge 91120 PALAISEAU, FRANCE 3 - Date & Durée 2019 - 6 mois environ 4 - Rémunération A définir (environ 1.000¤/mois)