OFFRE DE STAGE : Text-mining (TALN/Analyse sémantique) pour la maintenance d'éoliennes SUJET : Fouille de Textes non structurés pour constituer des bases de données d'événements de maintenance et d'exploitation avec des techniques de text-mining Traitement Automatique du Langage Naturel (TALN) et Analyse sémantique. CONTEXTE Sur les éoliennes des paramètres issus de capteurs permettent de réguler et de surveiller le fonctionnement des différents composants de l'installation et sont historisés dans des entrepôts de données. Lors de l'observation d'un phénomène inhabituel ou d'un paramètre proche des limites prévues de fonctionnement, l'exploitant consulte notamment ces séries de données numériques pour établir un diagnostic et un pronostic sur le phénomène sous-jacent et ses conséquences prévisibles. Son objectif est de déterminer si l'exploitation doit être adaptée ou interrompue pour maintenance ou si elle peut continuer jusqu'à la prochaine période de maintenance prévue. Pour interpréter les évolutions de ces paramètres dans le temps, il a besoin de prendre en compte des informations de contexte sur les opérations de maintenance (c'est-à-dire événements de maintenance) qui ont été réalisées sur l'installation ainsi que les événements d'exploitation subis par l'installation. Une grande partie de ces événements sont présents dans des documents textuels non structurés ou dans du texte libre d'outils de maintenance. L'objectif du stage est de contribuer à la reconstitution de bases d'événements de maintenance et d'exploitation à partir de corpus textuels non structurés. Il s'agit de mettre en oeuvre des techniques de fouille de données textuelles ou text-mining non pas statistiques (ou pas uniquement) mais de traitement automatique du langage naturel (TALN) et d'analyse sémantique afin de retrouver ces évènements présents dans les textes pour reconstituer ces bases d'évènements de maintenance et d'exploitation des installations. Un événement est une combinaison d'informations, comme par exemple pour la maintenance, une date, un composant d'un matériel, un type d'opération de maintenance et une action (prescription, réalisation, ...). Certaines de ces informations peuvent être corroborées par des informations structurées disponibles dans d'autres parties du système d'information (base de données de pièces de rechange...). Des documents peuvent ne contenir aucune des informations recherchées alors que d'autres documents peuvent en contenir plusieurs qu'il ne faudra pas mélanger. OBJECTIF ET DESCRIPTIF DU STAGE L'objectif est de réaliser un démonstrateur d'extraction d'informations complexes (événements, ou combinaisons d'informations) à partir de documents textuels non structurés de maintenance et d'exploitation pour constituer des bases de données en utilisant des techniques de fouille de texte de type TALN et d'Analyse Sémantique. Le travail de stage consiste à : - modéliser le domaine, la structure des textes, la structure cible des données à trouver dans les textes pour constituer les bases. - mettre en oeuvre les éléments nécessaires dans un ou des outils et notamment de réaliser des pré-traitements sur les corpus à analyser, d'utiliser des ressources, modèles, annexes, ontologies et notamment d'écrire des règles dans le formalisme du logiciel utilisé (logiciel de text mining TALN/analyse sémantique). - positionner la solution mise en oeuvre dans l'étude vis-à-vis des autres solutions déjà mises en oeuvre par EDF sur d'autres projets. ETUDIANTS CONCERNES : MASTER, ou Fin d'études ingénieur. COMPETENCES SOUHAITEES : La réalisation de cette étude nécessite des compétences en modélisation des connaissances, en techniques de fouille de textes, en text-mining de type Traitement Automatique du Langage Naturel et d'Analyse Sémantique, ainsi que des techniques et outils du web sémantique, notamment RDF). INFORMATION ET CANDIDATURE : En postulant sur cette offre sur le site internet edf recrute : https://www.edf.fr/edf-recrute/rejoignez-nous/voir-les-offres/nos-offres La référence de cette offre est : ST-16-8884-SME Lien vers cette offre : https://www.edf.fr/edf-recrute/rejoignez-nous/voir-les-offres/nos-offres?search[keyword]=ST-16-8884-SME CONDITIONS DU STAGE : Le stage se déroulera au sein des locaux d'EDF R&D à Chatou et sera rémunéré. DUREE : 5 mois.