Stage - TALN, text-mining et ontologies pour la maintenance d'éoliennes H/F (Ref. St-18-0018) Mise en ligne le 11/01/2018 Type d'offre : Offre de stage (long) Niveau de formation : A partir de bac +4 Spécialité(s) : Génie informatique / Télécommunications Domaine d'intervention : R&D Pays / Région(s) : France / Ile de France Département : YVELINES (78) Ville : CHATOU (78400) Nombre de places : 1 Description de la mission CONTEXTE DE LA MISSION Sur les éoliennes des paramètres issus de capteurs permettent de réguler et de surveiller le fonctionnement des différents composants de l'installation et sont historisés dans des entrepôts de données. Lors de l'observation d'un phénomène inhabituel ou d'un paramètre proche des limites prévues de fonctionnement, l'exploitant consulte notamment ces séries de données numériques pour établir un diagnostic et un pronostic sur le phénomène sous-jacent et ses conséquences prévisibles. Son objectif est de déterminer si l'exploitation doit être adaptée ou interrompue pour maintenance ou si elle peut continuer jusqu'à la prochaine période de maintenance prévue. Pour interpréter les évolutions de ces paramètres dans le temps, il a besoin de prendre en compte des informations de contexte sur les opérations de maintenance (c'est-à-dire événements de maintenance) qui ont été réalisées sur l'installation ainsi que les événements d'exploitation subis par l'installation. Une grande partie de ces événements sont présents dans des documents textuels non structurés ou dans du texte libre d'outils de maintenance. L'objectif du stage est de contribuer à la reconstitution de bases de données d'événements de maintenance et d'exploitation à partir de corpus textuels non structurés. Il s'agit de mettre en oeuvre des techniques de fouille de données textuelles ou text-mining non pas statistiques (ou pas uniquement) mais de traitement automatique du langage naturel (TALN) et d'analyse sémantique afin de retrouver ces évènements présents dans les textes pour reconstituer ces bases d'évènements de maintenance et d'exploitation des installations. Un événement est une combinaison d'informations, comme par exemple pour la maintenance, une date, un composant d'un matériel, un type d'opération de maintenance et une action (prescription, réalisation, ...). Certaines de ces informations peuvent être corroborées par des informations structurées disponibles dans d'autres parties du système d'information (base de données de pièces de rechange...). Des documents peuvent ne contenir aucune des informations recherchées alors que d'autres documents peuvent en contenir plusieurs qu'il ne faudra pas mélanger. De premiers démonstrateurs ont été réalisés en 2017 (stage et développement de chercheurs EDF R&D) pour répondre à un besoin métier et en exploitant des données textuelles de maintenance. La chaîne de traitement comporte notamment une phase de correction orthographique, des développements dans GATE (lexiques par catégorie d'actions, règles JAPE, ontologies) pour l'annotation ainsi qu'une restitution sous forme structurée des données extraites. Les premiers résultats ayant été jugés pertinents par le métier, nous souhaitons continuer les travaux au-delà du premier cas test, ce qui nécessite d'améliorer la chaîne de traitement. OBJECTIF DE LA MISSION L'objectif du stage est de proposer et de réaliser des améliorations sur la chaîne de traitement (amélioration des développements et de l'ontologie, développements complémentaires) afin de contribuer à améliorer les résultats, à généraliser à un périmètre plus large et à compléter la réponse au besoin d'analyse du retour d'expérience. Avec des techniques et outils de text mining TALN/analyse sémantique, le travail de stage consiste à : * Prendre connaissance de la chaîne de traitement, l'analyser et proposer des pistes d'amélioration ; * Contribuer à la priorisation des pistes d'amélioration avec les chercheurs EDF R&D ; * Concevoir, développer et évaluer des améliorations et compléments dans la chaîne de traitement ; * Positionner la solution mise en oeuvre dans l'étude vis-à-vis des autres solutions déjà mises en oeuvre par EDF sur d'autres projets. DEBUT : à partir du 2ème trimestre 2018 DUREE : 6 mois (stage rémunéré) Profil souhaité ETUDIANTS CONCERNES : MASTER, ou Fin d'études ingénieur. COMPETENCES SOUHAITEES : La réalisation de cette étude nécessite des compétences en modélisation des connaissances, en techniques de fouille de textes, en text-mining de type Traitement Automatique du Langage Naturel et d'Analyse Sémantique, ainsi que des techniques et outils du web sémantique, notamment RDF. Information et candidature En postulant sur cette offre sur le site internet edf recrute : https://www.edf.fr/edf-recrute/rejoignez-nous/voir-les-offres/nos-offres La référence de cette offre est : ST-18-0018 Lien vers cette offre : https://www.edf.fr/edf-recrute/rejoignez-nous/voir-les-offres/nos-offres?search[keyword]=ST-18-0018