Stage Bac + 5 de 4 à 6 mois au centre de R&D d'EDF de Clamart Sujet : Adaptation des techniques de text mining aux données conversationnelles issues de l'oral EDF utilise les techniques de Text Mining pour optimiser sa relation client, en analysant des questions ouvertes d'enquête de satisfaction, des textes libres et des retranscriptions de conversations issues des centres d'appels. La R&D d'EDF met en œuvre des techniques de text mining sur les transcriptions de conversations téléphoniques des centres d'appels. La chaîne de traitement text mining (lemmatisation, extraction de concept métier, segmentation, classement) permet ainsi de classer ces transcriptions selon différentes thématiques. Que ces conversations soient transcrites automatiquement ou manuellement, les entrées de la chaîne text mining diffèrent de celles classiquement traitées par les modules de text mining : il s'agit de données issues de l'oral (transcription littérale manuelle ou automatique) contenant de nombreuses disfluences comme par exemple : les hésitations, les bégaiements sur les amorces de mots, les phrases inachevées, les répétitions de mots ou de groupes de mots. Ces spécificités liées à l'oral sont difficiles à traiter, notamment lors de l'étape d'extraction de concepts métiers (cartouches de connaissance), extraction qui se fait à l'aide de règles, qui peuvent s'avérer peu adaptées à des données dont le fenêtrage syntaxique diffère de celui des données textuelles classiques. Par ailleurs, les modules de reconnaissance automatique de la parole utilisés génèrent un certain nombre d'erreurs incluant des erreurs de ponctuation qui viennent ainsi altérer la transcription. Dans les deux cas, transcriptions manuelles et automatiques, l'objectif de se stage sera d'analyser l'impact de l'oral sur la chaîne text mining et de proposer des alternatives aux méthodes utilisées jusque maintenant sur des données textuelles. Profil recherché : Bac+5, stage de fin d'étude dans le domaine du TALN et/ou du traitement de la parole. Contact et envoi des candidatures : Chloé Clavel , 01 47 65 43 15, chloe.clavel@edf.fr Anne Peradotto , 01.47.65.44.89, anne.peradotto@edf.fr Lieu du stage : EDF R&D, 1, av du Général de Gaulle, 92141 Clamart Cedex Durée : 6 mois environ Rémunération : environ 1.000€/mois Chloe CLAVEL Ingénieur chercheur EDF ICAME 1, av. du Général de Gaulle 92141 Clamart chloe.clavel@edf.fr Tél. : 33 (0)1 47 65 43 15