INTITULE DE LA MISSION : Réalisation d'un modèle de catégorisation automatique pour l'analyse automatique d'une question ouverte d'enquête de satisfaction. Date de début : entre avril et juin 2015 Durée du stage : 6 mois Niveau de diplôme préparé : MASTER 2 spécialisé en Ingénierie Linguistique / Traitement automatique des langues SERVICES D'ACCUEIL : EDF - Direction Commerce - Tête de Direction : oui non - Direction : Domaine Analyse Connaissance Client - Département : Département Analyse Client et Publication (ACP) CONTEXTE ET DESCRIPTION DU STAGE Depuis le 1er juillet 2007, le marché de l'électricité est entièrement ouvert à la concurrence et permet au consommateur de choisir librement son fournisseur d'énergie. Dans ce contexte, il est d'autant plus important pour EDF de comprendre les besoins de ses clients, mais également d'expliquer et de prédire leur comportement. Le département Analyse Client et Publication (ACP) a pour mission d'analyser les données provenant des différents systèmes d'information et notamment les données textuelles. Actuellement, nous utilisons des techniques de Text Mining à travers les outils de Temis pour analyser automatiquement des commentaires provenant de nos SI mais également les réponses aux questions ouvertes d'enquêtes de satisfaction. Le stage que nous proposons est opérationnel et a pour objectif la mise en place d'un modèle d'analyse automatique des réponses à des questions ouvertes issues d'enquêtes de satisfaction. Présentation de la mission La mission se composera de quatre étapes : - L'exploration de corpus avec des outils de classifications automatiques - La définition d'un plan de catégorisation en lien avec les équipes opérationnelles - L'annotation de données - La création d'un modèle de catégorisation et de règles d'extraction de connaissances PROFIL RECHERCHE : - De formation Master II spécialisé en Traitement Automatique du Langage - Domaines de compétence requis : - Linguistique et informatique - Des connaissances en statistique seraient appréciées - Rigueur, autonomie et aisance rédactionnelle. les candidatures sont à adresser à Anne-Laure GUENET : anne-laure.guenet@edf.fr Anne-Laure GUENET Chef de projet Text Mining EDF- Commerce - DSI Domaine ACC - Département Analyses Clients et Publications 20, place de la défense Bureau 9P06 92050 PARIS LA DEFENSE CEDEX anne-laure.guenet@edf.fr Tél. : 01.56.65.22.87